Update README.md
Browse files
README.md
CHANGED
@@ -11,8 +11,120 @@ tags:
|
|
11 |
- trl
|
12 |
---
|
13 |
|
14 |
-
|
15 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
16 |
- **Developed by:** iknow-lab
|
17 |
- **License:** apache-2.0
|
18 |
- **Finetuned from model :** MLP-KTLim/llama-3-Korean-Bllossom-8B
|
|
|
11 |
- trl
|
12 |
---
|
13 |
|
14 |
+
<img src="https://huggingface.co/iknow-lab/ko-genstruct-v0.1/resolve/main/image.webp" />
|
15 |
|
16 |
+
# 0725-ko-genstruct-v0.2-simple-qa
|
17 |
+
|
18 |
+
Ko-genstruct๋ ์ฃผ์ด์ง ๋ฌธ์๋ก๋ถํฐ instruction tuning์ ํ์ํ instruction์ ์์ฑํด๋ด๋ ๋ชจ๋ธ์
๋๋ค.
|
19 |
+
|
20 |
+
| ๋ชจ๋ธ | ์ ํ |
|
21 |
+
|-----|-----|
|
22 |
+
| [iknow-lab/0725-ko-genstruct-v0.2-simple-qa](https://huggingface.co/iknow-lab/0725-ko-genstruct-v0.2-simple-qa) | ๋จ์ํ ์ง๋ฌธ๊ณผ ๋ต๋ณ ์์ฑ |
|
23 |
+
| [iknow-lab/0725-ko-genstruct-v0.2-writing](https://huggingface.co/iknow-lab/0725-ko-genstruct-v0.2-writing) | ๊ธ์ฐ๊ธฐ ์ง์๋ฌธ๊ณผ ๋ต๋ณ ์์ฑ |
|
24 |
+
| [iknow-lab/0725-ko-genstruct-v0.2-creative_writing](https://huggingface.co/iknow-lab/0725-ko-genstruct-v0.2-creative_writing) | ์ฐฝ์์ ์ธ ๊ธ์ฐ๊ธฐ ์ง์๋ฌธ๊ณผ ๋ต๋ณ ์์ฑ |
|
25 |
+
|
26 |
+
์ด ๋ชจ๋ธ์ [Ada-instruct](https://arxiv.org/abs/2310.04484)์ [Genstruct](https://huggingface.co/NousResearch/Genstruct-7B)๋ก๋ถํฐ ์๊ฐ์ ๋ฐ์์ต๋๋ค.
|
27 |
+
|
28 |
+
๋ค์๊ณผ ๊ฐ์ ์ฉ๋๋ก ํ์ฉํ ์ ์์ต๋๋ค.
|
29 |
+
- ๊ฒ์ ๋ชจ๋ธ์ ํ์ตํ๊ธฐ ์ํด ์ฃผ์ด์ง ํ
์คํธ๋ก๋ถํฐ ์ง๋ฌธ์ ์์ฑํ๊ธฐ
|
30 |
+
- ๋ณด์ ํ ๋ฐ์ดํฐ๋ฅผ ์ด์ฉํ์ฌ Instruction Tuning ํ์ต ๋ฐ์ดํฐ๋ฅผ ์์ฑ
|
31 |
+
|
32 |
+
|
33 |
+
|
34 |
+
# ์ฌ์ฉ๋ฐฉ๋ฒ
|
35 |
+
## ์์ฑ ์์
|
36 |
+
**์ฃผ์**: simple-qa ๋ชจ๋ธ์ ์์ฑํ๋ ์ง๋ฌธ์ ๋ค์์ฑ์ด ๋ฎ์ต๋๋ค. ๋ฐ๋ผ์ ๊ธด ํ
์คํธ๋ฅผ ํต์งธ๋ก ์ฃผ๊ธฐ๋ณด๋ค ์ ๋นํ ๊ท๋ชจ๋ก ์๋ผ์ ์ฌ์ฉํ์๊ธฐ๋ฅผ ๊ถ์ฅํฉ๋๋ค.
|
37 |
+
|
38 |
+
```python
|
39 |
+
import transformers
|
40 |
+
|
41 |
+
transformers.logging.set_verbosity_error()
|
42 |
+
|
43 |
+
import transformers
|
44 |
+
import peft
|
45 |
+
|
46 |
+
model_id = "MLP-KTLim/llama-3-Korean-Bllossom-8B"
|
47 |
+
peft_model_id = "iknow-lab/0725-ko-genstruct-v0.2-simple-qa"
|
48 |
+
|
49 |
+
tokenizer = transformers.AutoTokenizer.from_pretrained(model_id)
|
50 |
+
model = transformers.AutoModelForCausalLM.from_pretrained(model_id, device_map="cuda:0", torch_dtype="auto").eval()
|
51 |
+
|
52 |
+
model.load_adapter(peft_model_id)
|
53 |
+
|
54 |
+
|
55 |
+
text = """7์ผ(ํ์ง์๊ฐ) ์น๋ฌ์ง ํ๋์ค ์กฐ๊ธฐ ์ด์ ๊ฒฐ์ ์์ ์ขํ์ฐํฉ ์ ๋ฏผ์ค์ ์ (NFP)์ด ์์์ ๊นจ๊ณ ๊ทน์ฐ ๊ตญ๋ฏผ์ฐํฉ(RN)์ ๋๋ฅด๊ณ 1๋น ์๋ฆฌ๋ฅผ ์ฐจ์งํ๋ค. 1์ฐจ ํฌํ์์ 1์๋ฅผ ์ฐจ์งํ๋ฉฐ ์ด์ ๊ธฐ๊ฐ ๋ด๋ด ์ง์ง์จ 1์์๋ RN์ ๋ฒ์ฌ๊ถ๊ณผ ์ขํ์ ๋จ์ผํ ๋ฒฝ์ ๋ถ๋ชํ 3์๋ก ๋ฐ๋ ค๋ฌ๋ค.
|
56 |
+
|
57 |
+
8์ผ ํ๋์ค ๋ด๋ฌด๋ถ์ ๋ฐ๋ฅด๋ฉด ์ด์ ๊ฒฐ์ ํฌํ ๊ฒฐ๊ณผ, NFP๊ฐ ํ์ 577์ ์ค 182์์ ์ป์ด ์๋ด 1๋น ์๋ฆฌ์ ์ฌ๋๋ค. ์๋ง๋์ ๋งํฌ๋กฑ ๋ํต๋ น์ ๋ฅด๋ค์์ค๋น์ ์ค์ฌ์ผ๋ก ํ ์ฌ๊ถ ์ฐํฉ ์์๋ธ์ 168์์ผ๋ก 2์๋ฅผ ์ฐจ์งํ๋ค. RN์ 143์์ ์ป๋ ๋ฐ ๊ทธ์ณค๋ค.
|
58 |
+
|
59 |
+
RN์ ์ง๋๋ฌ 30์ผ 1์ฐจ ํฌํ์์ 33.2%๋ฅผ ๋ํํด 1์์ ์ค๋ฅด๋ฉด์ 2์ฐจ ๊ฒฐ์ ํฌํ์์ 240โผ270์์ ์ป์ ๊ฒ์ผ๋ก ์ ๋ง๋๋ค. ํ์ง๋ง ๊ทน์ฐ ์ง๊ถ์ ๋ง๊ธฐ ์ํด NFP์ ์์๋ธ์ด ๋๋์ ์ธ ํ๋ณด ๋จ์ผํ์ ๋์๋ฉด์ ํ์ธ๊ฐ ๋ค์งํ๋ค. RN์ ์กฐ๋ฅด๋น ๋ฐ๋ฅด๋ธ๋ผ ๋ํ๋ โ๋ถ๋ช
์์ค๋ฌ์ด ๋๋งน์ด ํ๋์ค๋ฅผ ๊ทน์ข์ ํ์ ๋์ง๊ณ ์๋คโ๋ฉฐ โ์ฐ๋ฆฌ๋ ํ๋์ค ๊ตญ๋ฏผ์ ํธ์ ์ค ๊ฒโ์ด๋ผ๊ณ ํ์ธต ๊ฐ๊ฒฝํ ๋์ ๋ถ ํฌ์์ ์๊ณ ํ๋ค.
|
60 |
+
|
61 |
+
์ด์ ๊ฒฐ๊ณผ ์๋ด 1๋น์ ์ฐจ์งํ๊ฒ ๋ NFP๋ ์ ๋ถ ์ด์์ ๋์ค ๋ป์ ๋ถ๋ช
ํ ํด 27๋
๋ง์ ๋๊ฑฐ์ ๋ถ๊ฐ ๋ค์ด์ค ๊ฒ์ผ๋ก ๋ณด์ธ๋ค. NFP ์์์ธ ๊ตด๋ณตํ์ง์๋ํ๋์ค(LFI)์ ์ฅ๋คผํฌ ๋ฉ๋์ ๋ํ๋ โ์ ๊ถ์๋ค์ด ๋ถ๊ฐ๋ฅํ ๊ฒ์ผ๋ก ์ฌ๊ฒจ์ง ์ขํ์ฐํฉ์ ์น๋ฆฌ๋ฅผ ๋ง๋ค์ด๋๋คโ๋ฉฐ โ์ขํ์ฐํฉ์ ์ง๊ถํ ์ค๋น๊ฐ ๋ผ ์๋คโ๊ณ ๋งํ๋ค. NFP ์์ ์ฌํ๋น์ ์ฌ๋ฆฌ๋น์ ํฌ๋ฅด ๋ํ๋ โํ๋์ค๋ RN์ด ์ง๊ถํ๋ ๊ฒ์ ๊ฑฐ๋ถํ๋คโ๋ฉฐ โNFP๊ฐ ์ฐ๋ฆฌ ์ญ์ฌ์ ์๋ก์ด ํ์ด์ง๋ฅผ ์ฑ
์์ ธ์ผ ํ๋คโ๊ณ ๊ฐ์กฐํ๋ค.
|
62 |
+
|
63 |
+
# ํํธ ๊ฐ๋ธ๋ฆฌ์ ์ํ ์ด๋ฆฌ๋ ์์๋ธ์ด 1๋น ์ง์๋ฅผ ํ๋ณดํ์ง ๋ชปํ ๋ฐ ๋ํด ์ฑ
์์ ์ง๊ฒ ๋ค๋ฉฐ ๋ํต๋ น์๊ฒ ์ฌ์๋ฅผ ํํ๊ฒ ๋ค๊ณ ๋ฐํ๋ค."""
|
64 |
+
|
65 |
+
|
66 |
+
PROMPT_QA = """์ฃผ์ด์ง ํ
์คํธ ์ปจํ
์ธ ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์ง๋ฌธ๊ณผ ์ ํํ๊ณ ์์ธํ ๋ต๋ณ์ ๋ง๋์ธ์, ๋๋ต์ ์๋ ํํ๋ก ์์ฑํ์ธ์
|
67 |
+
**๋ต๋ณ ํ์**
|
68 |
+
[[Q]] ์ง์๋ฌธ
|
69 |
+
|
70 |
+
[[A]] ๋ต๋ณ
|
71 |
+
---
|
72 |
+
{text}"""
|
73 |
+
|
74 |
+
|
75 |
+
def generate_question(text):
|
76 |
+
prompt = PROMPT_QA.format(text=text)
|
77 |
+
|
78 |
+
prompt = [{"content": prompt, "role": "user"}]
|
79 |
+
inputs = tokenizer.apply_chat_template(prompt, return_tensors="pt", add_generation_prompt=True, tokenize=False)
|
80 |
+
inputs = inputs.strip()
|
81 |
+
inputs = tokenizer.encode(inputs, add_special_tokens=False, return_tensors="pt").to(model.device)
|
82 |
+
outputs = model.generate(input_ids=inputs, max_new_tokens=256, do_sample=True, early_stopping=True, eos_token_id=128009, temperature=1.0)
|
83 |
+
|
84 |
+
question = tokenizer.decode(outputs[0, inputs.shape[1]:], skip_special_tokens=True)
|
85 |
+
|
86 |
+
return question
|
87 |
+
|
88 |
+
print(task)
|
89 |
+
for _ in range(5):
|
90 |
+
question = generate_question(text)
|
91 |
+
print(question)
|
92 |
+
```
|
93 |
+
|
94 |
+
## ์์ฑ ๊ฒฐ๊ณผ
|
95 |
+
```
|
96 |
+
[[Q]] ํ๋์ค ์ด์ ๊ฒฐ์ ๊ฒฐ๊ณผ์ ๋ํด ๊ฐ๋จํ ์ค๋ช
ํด์ฃผ์ธ์.
|
97 |
+
|
98 |
+
[[A]] ํ๋์ค ์ด์ ๊ฒฐ์ ์์ ์ขํ์ฐํฉ ์ ๋ฏผ์ค์ ์ (NFP)์ด ์์์ ๊นจ๊ณ 1๋น ์๋ฆฌ๋ฅผ ์ฐจ์งํ์์ผ๋ฉฐ, ๊ทน์ฐ ๊ตญ๋ฏผ์ฐํฉ(RN)์ 3์๋ฅผ ์ฐจ์งํ์์ต๋๋ค. 1์ฐจ ํฌํ์์ 1์๋ฅผ ์ฐจ์งํ RN์ ๋ฒ์ฌ๊ถ๊ณผ ์ขํ์ ๋จ์ผํ ๋ฒฝ์ ๋ถ๋ชํ 3์๋ก ๋ฐ๋ ค๋ฌ์ต๋
|
99 |
+
๋ค. NFP๋ ํ์ 577์ ์ค 182์์ ์ป์ด ์๋ด 1๋น ์๋ฆฌ์ ์ฌ๋์ต๋๋ค. ์๋ง๋์ ๋งํฌ๋กฑ ๋ํต๋ น์ ๋ฅด๋ค์์ค๋น์ ์ค์ฌ์ผ๋ก ํ ์ฌ๊ถ ์ฐํฉ ์์๋ธ์ 168์์ผ๋ก 2์๋ฅผ ์ฐจ์งํ์๊ณ , RN์ 143์์ ์ป๋ ๋ฐ ๊ทธ์ณค์ต๋๋ค. RN์ 2์ฐจ ๊ฒฐ์ ํฌํ์
|
100 |
+
์ 240โผ270์์ ์ป์ ๊ฒ์ผ๋ก ์ ๋ง๋์์ง๋ง, ๊ทน์ฐ ์ง๊ถ์ ๋ง๊ธฐ ์ํด NFP์ ์์๋ธ์ด ๋๋์ ์ธ ํ๋ณด ๋จ์ผํ์ ๋์๋ฉด์ ํ์ธ๊ฐ ๋ค์งํ์ต๋๋ค.
|
101 |
+
|
102 |
+
|
103 |
+
[[Q]] ํ๋์ค ์กฐ๊ธฐ ์ด์ ๊ฒฐ์ ์์ ์ขํ์ฐํฉ ์ ๋ฏผ์ค์ ์ (NFP)์ด ์์์ ๊นจ๊ณ ๊ทน์ฐ ๊ตญ๋ฏผ์ฐํฉ(RN)์ ๋๋ฅด๊ณ 1๋น ์๋ฆฌ๋ฅผ ์ฐจ์งํ๋ค. 1์ฐจ ํฌํ์์ 1์๋ฅผ ์ฐจ์งํ๋ฉฐ ์ด์ ๊ธฐ๊ฐ ๋ด๋ด ์ง์ง์จ 1์์๋ RN์ ๋ฒ์ฌ๊ถ๊ณผ ์ขํ์ ๋จ์ผํ ๋ฒฝ์ ๋ถ๋ช
|
104 |
+
ํ 3์๋ก ๋ฐ๋ ค๋ฌ๋ค. NFP๊ฐ ์ด์ ๊ฒฐ์ ํฌํ ๊ฒฐ๊ณผ ํ์ 577์ ์ค 182์์ ์ป์ด ์๋ด 1๋น ์๋ฆฌ์ ์ฌ๋๋ค. RN์ ์ง๋๋ฌ 30์ผ 1์ฐจ ํฌํ์์ 33.2%๋ฅผ ๋ํํด 1์์ ์ค๋ฅด๋ฉด์ 2์ฐจ ๊ฒฐ์ ํฌํ์์ 240โผ270์์ ์ป์ ๊ฒ์ผ๋ก ์ ๋ง๋๋ค. ํ์ง๋ง
|
105 |
+
๊ทน์ฐ ์ง๊ถ์ ๋ง๊ธฐ ์ํด NFP์ ์์๋ธ์ด ๋๋์ ์ธ ํ๋ณด ๋จ์ผํ์ ๋์๋ฉด์ ํ์ธ๊ฐ ๋ค์งํ๋ค. NFP ์์์ธ ๊ตด๋ณตํ์ง์๋ํ๋์ค(LFI)์ ์ฅ๋คผํฌ ๋ฉ๋์ ๋ํ๋ โ์ ๊ถ์๋ค์ด ๋ถ๊ฐ๋ฅ
|
106 |
+
|
107 |
+
ใด NOTE: ์๋ชป ์์ฑ๋ ์ผ์ด์ค ๐ญ
|
108 |
+
|
109 |
+
[[Q]] ํ๋์ค ์ด์ ๊ฒฐ์ ์์ ์ขํ์ฐํฉ ์ ๋ฏผ์ค์ ์ (NFP)์ด ์์์ ๊นจ๊ณ ๊ทน์ฐ ๊ตญ๋ฏผ์ฐํฉ(RN)์ ๋๋ฅด๊ณ 1๋น ์๋ฆฌ์ ์ค๋ฅธ ์ด์ ๋ ๋ฌด์์ธ๊ฐ์?
|
110 |
+
|
111 |
+
[[A]] ํ๋์ค ์ด์ ๊ฒฐ์ ์์ NFP์ ๊ทน์ฐ RN์ ๋๋ฅด๊ณ 1๋น ์๋ฆฌ์ ์ค๋ฅธ ์ด์ ๋ ๋ฒ์ฌ๊ถ๊ณผ ์ขํ์ ๋จ์ผํ ๋ฒฝ์ ๋ถ๋ชํ RN์ด 3์๋ก ๋ฐ๋ ค๋ฌ๊ธฐ ๋๋ฌธ์
๋๋ค. NFP์ ์ง๋ 1์ฐจ ํฌํ์์ 1์๋ฅผ ์ฐจ์งํ๋ฉฐ ์ด์ ๊ธฐ๊ฐ ๋ด๋ด ์ง์ง์จ 1์๋ฅผ ์ฐจ์งํ์ง
|
112 |
+
๋ง, RN์ ๊ทน์ฐ ์ง๊ถ์ ๋ง๊ธฐ ์ํด NFP์ ์์๋ธ์ด ๋๋์ ์ธ ํ๋ณด ๋จ์ผํ์ ๋์๋ฉด์ ํ์ธ๊ฐ ๋ค์งํ์ต๋๋ค. ์ด๋ก ์ธํด NFP์ 182์์ ์ป์ด ์๋ด 1๋น ์๋ฆฌ์ ์ฌ๋์ต๋๋ค.
|
113 |
+
|
114 |
+
|
115 |
+
[[Q]] 7์ผ ์น๋ฌ์ง ํ๋์ค ์กฐ๊ธฐ ์ด์ ๊ฒฐ์ ์์ ์ด๋ค ๊ฒฐ๊ณผ๊ฐ ๋์๊ณ , ์ด๋ ์์์ ์ด๋ป๊ฒ ๊นจ๋จ๋ ธ๋์ง ์ค๋ช
ํด ์ฃผ์ค ์ ์์๊น์?
|
116 |
+
|
117 |
+
[[A]] ํ๋์ค ์กฐ๊ธฐ ์ด์ ๊ฒฐ์ ์์ ์ขํ์ฐํฉ ์ ๋ฏผ์ค์ ์ (NFP)์ด ์์์ ๊นจ๊ณ ๊ทน์ฐ ๊ตญ๋ฏผ์ฐํฉ(RN)์ ๋๋ฅด๊ณ 1๋น ์๋ฆฌ๋ฅผ ์ฐจ์งํ๋ค. 1์ฐจ ํฌํ์์ 1์๋ฅผ ์ฐจ์งํ๋ฉฐ ์ด์ ๊ธฐ๊ฐ ๋ด๋ด ์ง์ง์จ 1์๋ฅผ ์ฐจ์งํ๋ RN์ ๋ฒ์ฌ๊ถ๊ณผ ์ขํ์ ๋จ์ผํ ๋ฒฝ
|
118 |
+
์ ๋ถ๋ชํ 3์๋ฅผ ์ฐจ์งํ๋ค. NFP๋ ํ์ 577์ ์ค 182์์ ์ป์ด ์๋ด 1๋น ์๋ฆฌ์ ์ฌ๋์ผ๋ฉฐ, ์๋ง๋์ ๋งํฌ๋กฑ ๋ํต๋ น์ ๋ฅด๋ค์์ค๋น์ ์ค์ฌ์ผ๋ก ํ ์ฌ๊ถ ์ฐํฉ ์์๋ธ์ 168์์ผ๋ก 2์๋ฅผ ์ฐจ์งํ๋ค. RN์ 143์์ ์ป๋ ๋ฐ ๊ทธ์ณค๋ค. NFP์
|
119 |
+
์น๋ฆฌ๋ RN์ด ์ง๊ถํ๋ ๊ฒ์ ๊ฑฐ๋ถํ ์ ๊ถ์๋ค์ ์ง์ง๋ฅผ ๋ฐ์ ๊ฒฐ๊ณผ๋ก ๋ณด์ธ๋ค.
|
120 |
+
|
121 |
+
|
122 |
+
[[Q]] ํ๋์ค ์กฐ๊ธฐ ์ด์ ๊ฒฐ์ ์์ ์ด๋ค ์ ๋น์ด 1๋น ์๋ฆฌ๋ฅผ ์ฐจ์งํ์๊ณ , ์ด๋ค ์ ๋น์ด 3์์ ๋จธ๋ฌผ๋ ์๊น์?
|
123 |
+
|
124 |
+
[[A]] ํ๋์ค ์กฐ๊ธฐ ์ด์ ๊ฒฐ์ ์์ ์ขํ์ฐํฉ ์ ๋ฏผ์ค์ ์ (NFP)์ด ์์์ ๊นจ๊ณ 1๋น ์๋ฆฌ๋ฅผ ์ฐจ์งํ์๊ณ , ๊ทน์ฐ ๊ตญ๋ฏผ์ฐํฉ(RN)์ด 3์์ ๋จธ๋ฌผ๋ ์ต๋๋ค.
|
125 |
+
```
|
126 |
+
|
127 |
+
# Model
|
128 |
- **Developed by:** iknow-lab
|
129 |
- **License:** apache-2.0
|
130 |
- **Finetuned from model :** MLP-KTLim/llama-3-Korean-Bllossom-8B
|