gemma-2-9b-HangulFixer
- Base Model: unsloth/gemma-2-9b-bnb-4bit
- Developed by: SeongeonKim
- Base Model License: Apache 2.0
- Finetuned Model License: CC BY-NC 4.0 (๋น์๋ฆฌ์ ์ฌ์ฉ๋ง ํ์ฉ)
- Language: Korean (ko)
- Tags:
- text-generation-inference
- transformers
- unsloth
- gemma2
- trl
- sft
๋ชจ๋ธ ์ค๋ช
gemma-2-9b-HangulFixer
๋ Unsloth์ Hugging Face์ TRL ๋ผ์ด๋ธ๋ฌ๋ฆฌ๋ฅผ ์ฌ์ฉํด fine-tuningํ ํ
์คํธ ์์ฑ ๋ชจ๋ธ์
๋๋ค.
์ด ๋ชจ๋ธ์ ๋๋
ํ๋ ํ๊ธ ํธํ
๋ฆฌ๋ทฐ๋ฅผ ์๋์ ๋ช
ํํ๊ณ ์์ฐ์ค๋ฌ์ด ๋ฆฌ๋ทฐ๋ก ๋ณต์ํ๊ธฐ ์ํด ์ค๊ณ๋์์ต๋๋ค.
๋ฐ์ดํฐ ๋ฐฐ๊ฒฝ
ํ๊ตญ ์์ ์์ฝ ์ฌ์ดํธ์์๋ ๋ถ์ ์ ์ธ ๋ฆฌ๋ทฐ๊ฐ ์ญ์ ๋ ์ ์๋ ์ฐ๋ ค๊ฐ ์์ต๋๋ค. ์ด๋ฅผ ํผํ๋ฉด์ ํ๊ตญ ์ฌ์ฉ์๋ค์๊ฒ๋ง ์ ์ฉํ ์ ๋ณด๋ฅผ ์ ๋ฌํ๊ธฐ ์ํด ์ผ๋ถ ์ฌ์ฉ์๋ค์ ๋ฆฌ๋ทฐ๋ฅผ ๋๋
ํํ๋ ๋ฐฉ์์ ์ฌ์ฉํด ์์งํ ํ๊ธฐ๋ฅผ ๋จ๊ธฐ๊ณ ์ ํฉ๋๋ค.
์ด ๋ฐฉ์์ ํ๊ตญ ์ฌ์ฉ์๋ค์๊ฒ๋ ์์งํ ์ ๋ณด๋ฅผ ์ ๊ณตํ๋ ์ฅ์ ์ด ์์ง๋ง, ์์ ์ด์์์ ๋ฐฉ๋ฌธ๊ฐ ๊ฐ ํผ๋๋ฐฑ ์ ๋ฌ์ ์ด๋ ต๊ฒ ๋ง๋ค์ด ์๋น์ค ํ์ง ํฅ์์ ์ฅ์ ๊ฐ ๋ ์ ์์ต๋๋ค.
ํ์ต ๋ฐ์ดํฐ
์ด ๋ชจ๋ธ์ SeongeonKim/ko-scrambled_v0.1 ๋ฐ์ดํฐ์
์ ํ์ต ๋ฐ์ดํฐ๋ฅผ ์ฌ์ฉํด ํ์ต๋์์ต๋๋ค.
์ด 11,263๊ฐ์ ๋๋
ํ๋ ํ๊ธ ํธํ
๋ฆฌ๋ทฐ์ ๊ทธ์ ์์ํ๋ ๋ณต์๋ ์๋ณธ ๋ฆฌ๋ทฐ๋ฅผ ์ฌ์ฉํด fine-tuning์ด ์งํ๋์์ต๋๋ค.
์ด ๋ฐ์ดํฐ์
์ ๋ฆฌ๋ทฐ์ ๋๋
ํ๋ ํํ(input
)์ ๋ณต์๋ ํํ(output
)๋ก ๊ตฌ์ฑ๋์ด ์์ต๋๋ค.
์์ ๋ฐ์ดํฐ:
- Input:
์ญ๋ฑ ์ ํบ๋ ค์ค ๊ตผ๋ฉ์จ ๋ทํ ์์ฉ ๋ณ๋ฃ. 2๋นก 3์์ฃ 88๋ง ์ธ ์ผค์ณ ํ๋๋จ, ์ธ์ ผ๊ท๋ด ์ฝ์ ์จ 1์ถฉ๊นฅ์ฅ ๋ท๋ฆด๋ด ์ฐ์ก ๋ผ๋ ฅ์นด์จ ์ฉํฉ๋ณํจ, ์๋ฃธ, ์ผ์ธ๊น์ฐ ํ์ ๋ท๋ ค์ฅผ. ํจํ ์น ์ ์จ๋? ์ ฅํ์ฅ ์ข์ฝฅ ์ฏ์ ์ดํซ์ ์ฅ๋ ๊บผ์ฎ. ๋ต๊ฐ ์ ธํ๋กญ ๋ฌ๋ ฅ๊ฐ ๊ฒธ๋ฉด ํ ๋์บ ์ธ ์๋? ๋ฅจ ๊ปํ์ ํฑ ์์. ๋นต์ฝ ๊ตถ๋ ๊ป ๊นจ๊ฟํ์ปจ๋ข ์ฝ๋ํ๋ ๋ฐํ ๋ฑ๋ฅ ๋ฑํ ์ฉก๊ฑบํ ๋ ํด์ ์์. ์ํ ๋ฌ๋๋ฝ๋ ๋ชปํ ํ? ๋ ์ ์บฌ์ค ํจํ ๋ฅธ ์ต๊ธฑ๊ฐ ์ช์บ๋ฎ ๋ป. ๋ ๊ฐ์ญ์ฐ ๋ฌซํ๋ ๊ตฃ. ํต๋๋ฎจ ์ด ์ํ ๋ซ์ฐ๋ ์ฟ๊ธธ ์ ๋ฉ๋ฎฌ ๋ฏ. ์ํฅ๋ ์๋๋ํํค ์ค์ฝํ ๋ฝ์ฝ ์์ธํด๋ ๋๊ฟ๋ฅ ์ ํจ. ์ด๊ธด ๋ญ ํ๋ ๊ต์ฌ์ฅใ ใ . ๋นต์ฅ ํ์งฑํ๋ ์์จ. ์๋ ํง์ฑต๋ํ ์พ๋ ํธ๋์ ์๋ก์ป? ์ปค์ค ๋ฑ์ฑ ์ ๋๊ณง ํ์ฐฝํจ ๊นจ๋ถํธ. ํฉ์งฑ์ฐ ๋ณ๋์ฃ์ง ์ง๋ฆฐ๋ฅ ๋ ๋๋ฝ๋ ๋ฝ. ๋ด์ ๋ซ์จ ํ์งฑ์ซ ์ฌ ๋ผ๋งํ ์งฏ์ธต. ์ธ๋นก์๋ ์์ถํจ๋ฉด์ ๋์๋๋ ์บ์ฟณํ๊ถค ์ฒญ์ํ ํ๋ด ํ๋๋ ์ฉก์ผ๋ ์ฑจ๋์์ฅ๋ง ๋์๋ ๊ฑ์ ๋ข. ๋ฐฉ๊ฝ ๊ฒ์ฐ ํํ๋ด ์ทธ์นจํ๊ต ์ฉก์ฝ๊น ์ฒด๋ฐ๋กญ ์ ํด์ฌ ์๋ ๋ ๋์์๋๋ ๋๋ ต๋ฑ๊ณฐ ๋จํ๊ณฏ ์์ธํ๊ผฒ ์ฅ๋ ์ ๋ฆ์๋ฎ. ๋ฐํ๋ผ ๋พฐ์ํ์. ์ณค๋๋ฅธ ์ณ ํค๋ฃ ์ฉก์ ์ํ ๊ฒ ๋ง์ฏค. ์ ํจํ , ๋ด๋ ์ ธ์ ธ๋ป๋ฅ๋ ๋ป. ์น๊ตผ ์๊ฐน์ผ๋ด ๋ ํค ์ ๊น๋ผ. ํ, ํ์ฌ ์ ๊ฐ. ๊ฝ์ง ๋ฃ ์ฐจ๋๊ณฌ ํ๋ ์ ๊ฐ.
- Output:
์ํ ์ ๋๋ฌ์ด ๊ธ์ก์ ๋นํด ์์ ๋ณ๋ก. 2๋ฐ 3์ผ์ 88๋ง ์ ๊ฒฐ์ ํ๋๋ฐ, ์ถฉ์ ๊ธฐ๋ ์์ด์ 1์ธต๊น์ง ๋น๋ฆฌ๋ฌ ์ง์ ๋ด๋ ค๊ฐ์ ์ ํ๋ฒํธ, ์ด๋ฆ, ์ธ์ธ๊น์ง ํด์ผ ๋น๋ ค์ค. ํธํ ์ ์ ์ค๋? ์๋น์ค ์ข๊ณ ์์ค ์ข์์ ์ค๋ ๊ฑฐ์ง. ๋ด๊ฐ ์ ํ๋ก ๋ด๋ ค๊ฐ ๊ฑฐ๋ฉด ํธํ ์ ์ ์ค๋? ๋ฃธ ์ปจ๋์ ๋ ์์. ๋ฐฉ์ด ๊ทธ๋ ๊ฒ ๊นจ๋ํ๊ฑฐ๋ ์ฑํฌ๋๋ ๋ฐ๋ฅ ๋ฑ๋ฑ ๋ฑํ ์ฒญ๊ฒฐํ ๋๋์ด ์์. ์ผ๋ฐ ๋ชจํ ๋ณด๋ค ๋ชปํ ๋ฏ? ๋ ์๊น์ด ํธํ ์ ์ฌ๊ธฐ๊ฐ ์ฒ์์ธ ๋ฏ. ๋ ๊ฐ์ด์น ๋ชปํ๋ ๊ณณ. ๋๋๋ฌธ ์ชฝ ์๋ ๋ค์๋ ์ฌ๊ธฐ ์ ๋จธ๋ฌผ ๋ฏ. ์ผํ๋ ์ฌ๋๋คํํ ์๊ณ ํ๋ผ๊ณ ์ธ์ฌํด๋ ๋๊พธ๋ ์ ํจ. ์ฌ๊ธด ๋ญ ํ๋ ๊ณณ์ธ์งใ ใ . ๋ฐฉ์ ํ์ฅ๋๋ ์์. ์๋ ํ์ฅ๋๋ ์๋ ํธํ ์ด ์๋์? ๊ฑฐ์ค ํ์์ ๋๊ณ ํ์ฅํจ ๊ฐ๋ถํธ. ํ์ฅ์ค ๋ณ๊ธฐ์์ ์ง๋ฆฐ๋ด ๋จ ๋๋ฝ๋๋ฝ. ๋์ ๋์ ํ์ฅ์ค ์ธ ๋๋ง๋ค ์ง์ฆ. ์ฐ๋ฐ์ด๋ผ ์ธ์ถํ๋ฉด์ ๋์๋๋ ๊นจ๋ํ๊ฒ ์ฒญ์ํด ๋ฌ๋ผ ํ๋๋ฐ ์ฒญ์๋ ์๋์์ง๋ง ๋์๋ ๊ณ์ ๋จ. ๋ฐฉ๊ณผ ๊ฑฐ์ค ๋ฐ๋ฅ๋ ์ฐ์ฐํ๊ณ ์ฒญ์๊ฐ ์ ๋๋ก ์ ๋์ด ์๋ ๋๋์ด์๋๋ฐ ๋๋ฝ๋ค๊ณ ๋งํ๊ณ ์ธ์ถํ๊ณ ์ค๋ ์ ๋ฆ์๋. ๋ฐ๋ฅ์ด ๋ฝ์กํ์. ์ฒซ๋ ์ ์ ๋๋ก ์ฒญ์ ์ํ ๊ฑฐ ๋ง์. ์ด ํธํ , ๋์ ์ ์ ๋ฒ๋ฆฌ๋ ๋ฏ. ์ง๊ธ ์๊ฐํด๋ ๋ ๋ ์๊น๋ค. ํฅ, ๋ค์ ์ ๊ฐ. ๊ณต์ง๋ก ์๋ผ๊ณ ํด๋ ์ ๊ฐ.
๋ชจ๋ธ ์ฑ๋ฅ
- Base Model:
unsloth/gemma-2-9b-bnb-4bit
๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ํ์ต๋์์ต๋๋ค. - Training Efficiency: Unsloth๋ฅผ ์ฌ์ฉํด 2๋ฐฐ ๋ ๋น ๋ฅธ ์๋๋ก ํ์ต ์๋ฃ.
- Target Task: ํ ์คํธ ๋ณต์
- Language: ํ๊ธ
์ฌ์ฉ ๋ฐฉ๋ฒ
์๋๋ ๋ชจ๋ธ์ ์ฌ์ฉํ๋ ๊ธฐ๋ณธ์ ์ธ ์์ ์ ๋๋ค:
from transformers import AutoModelForCausalLM, AutoTokenizer
# ๋ชจ๋ธ ๋ก๋
model_name = "SeongeonKim/gemma-2-9b-HangulFixer"
model = AutoModelForCausalLM.from_pretrained(model_name).to("cuda")
tokenizer = AutoTokenizer.from_pretrained(model_name)
# ํ
์คํธ ์
๋ ฅ
input_text = "๋
๋ฎจ๋๋ญ
๋ง์ฃก์ญ๋ฌ์ค ํจํ
๋คผ์์ค. ํธ์ธ๋ผ ์ฐ๋ฉด ์ฝ ์ธ์ฉํ๊ผฌ ์ถ์ ์ฝง์ฐ์จ์ค."
inputs = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=128)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
์์ ์ ์ด์ฉ ๊ด๋ จ ์ ํ ์ฌํญ
์ด ๋ชจ๋ธ์ ํ์ต ๋ฐ์ดํฐ์ ๋ผ์ด์ ์ค์ ๋ฐ๋ผ CC BY-NC 4.0 ๋ผ์ด์ ์ค๋ฅผ ๋ฐ๋ฆ
๋๋ค.
์ด ๋ผ์ด์ ์ค๋ ๋น์๋ฆฌ์ ์ฌ์ฉ๋ง ํ์ฉํ๋ฉฐ, ์์
์ ์ฉ๋๋ก ์ฌ์ฉํ๋ ค๋ฉด ๋ณ๋์ ํ๊ฐ๊ฐ ํ์ํฉ๋๋ค.
๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ๋ ๊ฒฝ์ฐ, ์ฐ๊ตฌ ๋ชฉ์ ์ผ๋ก ์ฌ์ฉํ๊ฑฐ๋ ํ์ต ๋ฐ์ดํฐ์ ์ถ์ฒ์ ๋ผ์ด์ ์ค๋ฅผ ๋ช
ํํ ํ๊ธฐํด์ผ ํฉ๋๋ค.
- ๋ผ์ด์ ์ค ์ธ๋ถ์ฌํญ: CC BY-NC 4.0
๋ชจ๋ธ ๊ฐ๋ฐ ๊ด๋ จ ์ฐธ๊ณ ์ฌํญ
- ์ฌ์ฉ๋ ๊ธฐ์ : Unsloth์ Hugging Face์ TRL(SFT) ์ฌ์ฉ
- ๋ฐ์ดํฐ ์ถ์ฒ: SeongeonKim/ko-scrambled_v0.1 ๋ฐ์ดํฐ์
- ์ฌ์ฉ ์ ํ: ๋ฐ์ดํฐ์ ๋ผ์ด์ ์ค๋ฅผ ์ค์ํ๋ฉฐ, ์์ ์ ์ฉ๋๋ก ์ฌ์ฉ ๋ถ๊ฐ
This gemma2 model was trained 2x faster with Unsloth and Huggingface's TRL library.
- Downloads last month
- 41