Usage Guide
๊ฐ์ธ์ ์์ ๋กญ๊ฒ ์ฌ์ฉํ ์ ์์ต๋๋ค.
๊ธฐ์
๋ฐ ๊ธฐ๊ด์ ๋น์์
์ ๋ชฉ์ ์ผ๋ก ์ด์ฉํด ์ฃผ์๊ธฐ ๋ฐ๋๋๋ค.
๋ํ, ์ถํ ํ์
๋ฐ ๋คํธ์ํฌ ๊ตฌ์ถ์ ์ํด ๊ธฐ๊ด ์ ๋ณด์ AI ๋ชจ๋ธ ์ฌ์ฉ ๋ด๋น์ ์ ๋ณด๋ฅผ ๋ฉ์ผ๋ก ๋ณด๋ด์ฃผ์๋ฉด ์ฐ๋ฝ๋๋ฆฌ๊ฒ ์ต๋๋ค.
CONTACT : [email protected]
Individuals are free to use this without restrictions.
For companies and institutions, please use it for non-commercial purposes.
Additionally, to facilitate future collaboration and network building, please send us an email with your institution's information and the contact details of the person responsible for using the AI model. We will get in touch with you.
1. Description
SPARK-Summarization is a large language model developed by the Korea Institute of S&T Evaluation and Planning (KISTEP). This model specializes in summarization tasks and utilizes Chain of Density (CoD) reasoning to provide high-quality, condensed summaries in both Korean and English.
2. Key Features
- Enhanced Summarization through CoD: Delivers high-quality summaries using the Chain of Density approach, ensuring comprehensive yet concise output.
- Multilingual Support: Capable of processing and generating summaries in both Korean and English.
- Structured Output: Provides summaries in a bullet-point format for improved readability and quick comprehension.
- Base Model: Built on Mistral-nemo as the foundation model
- Training Method: Trained with Supervised Fine-Tuning (SFT)
- Context Length: The maximum context length for training data is 16,384.
3. Data
source | KISTEP Documents |
---|---|
count | 24,417 |
4. Usage
- When using ollama, you can utilize the Modelfile.
- Recommended Prompt Template
(input: {TITLE}, {DOCUMENT})
propmt_template: |
๋น์ ์ ์์ฝ ์ ๋ฌธ๊ฐ์
๋๋ค. ์ฃผ์ด์ง ํ
์คํธ๋ฅผ ์ฐธ๊ณ ํ์ฌ ์์ฝ์ ์์ฑํ์ธ์.
## ์์ฝ ๋จ๊ณ:
1. ํ
์คํธ ๋ถ์:
- ๋ฌธ์ ์ ๋ชฉ๊ณผ ํ
์คํธ๋ฅผ ์ฃผ์ ๊น๊ฒ ์ฝ๊ณ , ๋ฌธ์์ ์ฃผ์ ์ฃผ์ ๋ฅผ ํ์
ํ์ธ์.
2. ์ฃผ์ ์ฃผ์ฅ(key_argument) ์๋ณ:
- ๋ค์ ์ง๋ฌธ์ ๋ต๋ณํ๊ธฐ: "์ด ํ
์คํธ์ ์ฃผ์ ์ฃผ์ฅ ๋๋ ํต์ฌ ๋
ผ์ ์ ๋ฌด์์ธ๊ฐ?"
3. ์ฃผ์ ๊ฐ์ฒด(entities) ์ถ์ถ:
- 5๋จ์ด ์ดํ์ ์ฃผ์ ๊ฐ์ฒด 3๊ฐ๋ฅผ ๋ฝ์์ฃผ์ธ์.
4. ์์ฝ๋ฌธ์ ์ฃผ์ (title) ์์ฑ:
- ์ ๊ณต๋ ํ
์คํธ์ ๋ํ ๊ฐ๊ฒฐํ ํ๋ฌธ์ฅ์ ์ฃผ์ ๋ฅผ ์์ฑํ์ธ์.
5. ์์ฝ(summary) ์์ฑ:
- ์ฃผ์ ์ฃผ์ฅ๊ณผ ์ฃผ์ ๊ฐ์ฒด, ์ฃผ์ ๋ฅผ ์ฐธ๊ณ ํ์ฌ ํ
์คํธ์ ์ฃผ์ ๋ด์ฉ์ ์์ฝํ์ธ์.
## ํฅ์ ๋จ๊ณ
6. ๋ฐ๋ ํฅ์:
- ์ด๊ธฐ ์์ฝ์ ํฌํจ๋์ง ์์ 1~3๊ฐ์ ์ถ๊ฐ ์ค๋ช
๊ฐ์ฒด๋ฅผ ์๋ณํ์ธ์.
- ์ด์ ๋ฐ ์ ๊ฐ์ฒด๋ฅผ ๋ชจ๋ ํตํฉํ์ฌ ์์ฝ์ ๋ฐ๋๊ฐ ๋์ ๋ฒ์ ์ ์์ฑํ์ธ์.
7. ์ค์๋ ํ๊ฐ:
- ์ด์ ์์ฝ์์ ํ์์ ์ธ ๋ถ๋ถ์ ๊ฐ์กฐํ๊ณ ๋ ์ค์ํ ๋ถ๋ถ์ ์ค์ฌ์ ์์ ํ์ธ์.
- ์ ์์ฝ์ด ์ฃผ์ ์ฃผ์ฅ๊ณผ ๋ฐ์ ํ๊ฒ ์ผ์นํ๋์ง ํ์ธํ์ธ์.
8. ์ ์ฐฝ์ฑ ํฅ์:
- ๋ฌธ๋ฒ, ๋จ์ด ์ ํ, ํํ์ ๋ค๋ฌ์ด ๊ฐ๋
์ฑ๊ณผ ์์ฐ์ค๋ฌ์ด ํ๋ฆ์ ํฅ์์ํค์ธ์.
- ์์ฝ ์ธ๋ถ๋ด์ฉ์ ์ ํ์ฑ๊ณผ ์์ ์ฑ์ ์ ์งํ๋ฉด์ ๋ฌธ์ฅ ๊ตฌ์กฐ๋ฅผ ๊ฐ์ ํ์ธ์.
## ์์ฑ ๋ฐฉ์:
- ๋ฌธ์๋ฅผ ์๊ฐํ๋ ๋์ ์์ฝ ๋ด์ฉ๋ง ์์ฑํ์ธ์.
- ๊ตฌ์ฒด์ ์ธ ๋ฐ์ดํฐ๋ ์์น๋ณด๋ค๋ ์ ์ฒด ํ๋ฆ๊ณผ ๋ฐฉํฅ์ ์ค๋ช
ํ์ธ์.
- ์ฃผ์ด์ง ๋ด์ฉ์๋ง ๊ธฐ๋ฐํด ๊ฐ๊ด์ ์ผ๋ก ์์ฑํ์ธ์.
- ํ๊ตญ์ด๋ก ์์ฑํ๋, ์์ด ๊ธฐ์ ์ฉ์ด์ ๊ณ ์ ๋ช
์ฌ๋ ๊ทธ๋๋ก ์ฌ์ฉํ์ธ์.
## ์
๋ ฅ:
### ๋ฌธ์ ์ ๋ชฉ:
{TITLE}
### ํ
์คํธ:
{DOCUMENT}
## ์ถ๋ ฅ ํ์:
<reason>
์ด๊ธฐ ์ฃผ์ ์ฃผ์ฅ: [์ด๊ธฐ ์ฃผ์ ์ฃผ์ฅ]
์ด๊ธฐ ์ฃผ์ ๊ฐ์ฒด: [์ด๊ธฐ ์ฃผ์ ๊ฐ์ฒด ๋ชฉ๋ก]
์ด๊ธฐ ์ ๋ชฉ: [์ด๊ธฐ ์ ๋ชฉ]
์ด๊ธฐ ์์ฝ: [์ด๊ธฐ ์์ฝ ๋ด์ฉ]
๋ฐ๋ ํฅ์ ๋จ๊ณ:
์๋ก ์ถ๊ฐ๋ ์ฃผ์ ๊ฐ์ฒด: [์๋ก ์ถ๊ฐ๋ ์ฃผ์ ๊ฐ์ฒด ๋ชฉ๋ก(with bullet points)]
์ฌ๊ณ ๊ณผ์ : [์ฃผ์ ๊ฐ์ฒด ์ ํ ๋ฐ ์์ฝ ์์ฑ์ ๋ํ ์ค๋ช
]
์
๋ฐ์ดํธ ์ ๋ชฉ: [์
๋ฐ์ดํธ ์ ๋ชฉ]
์
๋ฐ์ดํธ ์์ฝ: [์
๋ฐ์ดํธ ์์ฝ ๋ด์ฉ]
์ค์๋ ํ๊ฐ ๋จ๊ณ:
์ฌ๊ณ ๊ณผ์ : [์์ฝ ๊ด๋ จ์ฑ ํฅ์์ ์ํ ์ค์๋ ํ๊ฐ ๋ฐ ๋ณ๊ฒฝ๋ ์ฌํญ์ ๋ํ ์ค๋ช
]
์
๋ฐ์ดํธ ์ ๋ชฉ: [์
๋ฐ์ดํธ ์ ๋ชฉ]
์
๋ฐ์ดํธ ์์ฝ: [์
๋ฐ์ดํธ ์์ฝ ๋ด์ฉ]
์ธ์ด ์ ์ฒญ์ฑ ๋จ๊ณ:
์ฌ๊ณ ๊ณผ์ : [์ธ์ด ๋ช
ํ์ฑ๊ณผ ์ ์ฐฝ์ฑ์ ๊ฐ์ ํ๊ธฐ ์ํด ๋ณ๊ฒฝ๋ ์ฌํญ์ ๋ํ ์ค๋ช
]
์
๋ฐ์ดํธ ์ ๋ชฉ: [์
๋ฐ์ดํธ ์ ๋ชฉ]
Updated Summary: [์์ฝ์ ๊ฐ ๋ฌธ์ฅ ๋ชฉ๋ก(with bullet points)]
</reason>
<output>
<key_argument>[์ฃผ์ ์ฃผ์ฅ(ํ๊ตญ์ด)]</key_argument>
<entities>[์ฃผ์ ๊ฐ์ฒด ๋ชฉ๋ก, ์ผํ๋ก ๊ตฌ๋ถ]</entities>
<title>[์ฃผ์ (ํ๊ตญ์ด)]</title>
<summary>
<point>[์ฒซ๋ฒ์งธ ์์ฝ ๋ฌธ์ฅ(ํ๊ตญ์ด)]</point>
<point>[๋๋ฒ์งธ ์์ฝ ๋ฌธ์ฅ(ํ๊ตญ์ด)]</point>
...
</summary>
</output>
5. Benchmark
TBD
- Downloads last month
- 12
16-bit
Model tree for kistepAI/SPARK-Summarization-GGUF
Base model
mistralai/Mistral-Nemo-Base-2407