Update README.md
Browse files
README.md
CHANGED
@@ -105,17 +105,34 @@ generated_ids = model.generate(
|
|
105 |
| ------------- | ----------------------------- | -------------------------- |
|
106 |
| **Alice, Bob, Charlie๊ฐ 3ํ์ ๊ฒ์์์ ์ ์๋ฅผ ๋ฐ์์ต๋๋ค.<br>Alice์ ์ ์๋ Bob์ ์ ์์ ๋ ๋ฐฐ์ด๋ฉฐ, Bob์ ์ ์๋ Charlie์ 4๋ฐฐ์
๋๋ค.<br>Charlie๊ฐ 10์ ์ ๋ฐ์๋ค๋ฉด ์ด 3๋ช
์ ํ๊ท ์ ์๋ฅผ ๊ณ์ฐํ์ธ์.** |<br>Charlie์ ์ ์๋ 10์ ์
๋๋ค.<br>Bob์ ์ ์๋ Charlie์ 4๋ฐฐ์ด๋ฏ๋ก, Bob์ ์ ์๋ <br>$$<br>4 \\times 10 = 40<br>$$<br>์ ์
๋๋ค.<br>Alice์ ์ ์๋ Bob์ ์ ์์ ๋ ๋ฐฐ์ด๋ฏ๋ก, Alice์ ์ ์๋ <br>$$<br>2 \\times 40 = 80<br>$$<br>์ ์
๋๋ค.<br>์ธไบบ็ ์ด ์ ์๋ <br>$$<br>10 + 40 + 80 = 130<br>$$<br>์ ์
๋๋ค.<br>ํ๊ท ์ ์๋ <br>$$<br>\\frac{130}{3} \\approx 43.33$์ ์
๋๋ค.<br>$$<br>\\boxed{43.33}<br>$$<br>Charlie์ ์ ์๋ 10์ ์
๋๋ค. | <br>Charlie์ ์ ์๋ 10์ ์ผ๋ก ์ฃผ์ด์ก์ต๋๋ค. Bob์ ์ ์๋ Charlie์ ์ ์์ 4๋ฐฐ์ด๋ฉฐ, ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋ฉ๋๋ค:<br>$$<br>4 \times 10 = 40<br>$$<br>Alice์ ์ ์๋ Bob์ ์ ์์ ๋ ๋ฐฐ์ด๋ฉฐ, ์ด๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:<br>$$<br>2 \times 40 = 80<br>$$<br>์ธ ์ฌ๋์ ์ด ์ ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:<br>$$<br>10 + 40 + 80 = 130<br>$$<br>์ด ์ธ ์ฌ๋์ ํ๊ท ์ ์๋ ์ด ์ ์๋ฅผ ์ฌ๋ ์๋ก ๋๋์ด ๊ณ์ฐ๋ฉ๋๋ค:<br>$$<br>\frac{130}{3}<br>$$<br>๋ฐ๋ผ์, ์ด ์ธ ์ฌ๋์ ํ๊ท ์ ์๋ <br>$$<br>\boxed{\dfrac{130}{3}}<br>$$<br>์
๋๋ค. |
|
107 |
| **์์๊ฐ ๋ฌดํํ๋ค๋ ์ฌ์ค์ 3๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์ฆ๋ช
ํ์์ค.** | <br>ไปฅไธๆฏ็จไธ็งๆนๆณ่ฏๆ็ด ๆฐๆ ้็่ฏฆ็ปๆญฅ้ชค๏ผ<br>### ๆนๆณไธ๏ผๆฌงๅ ้ๅพ็ๅ่ฏๆณ<br>1. **ๅ่ฎพ**๏ผๅ่ฎพ็ด ๆฐๆฏๆ้็๏ผไธๆๆ็ด ๆฐไธบ $ p_1, p_2, p_3, \\ldots, p_n $ใ<br>2. **ๆ้ ๆฐ**๏ผๆ้ ไธไธชๆฐๆฐ $ N = (p_1 \\times p_2 \\times p_3 \\times \\ldots \\times p_n) + 1 $ใ<br>3. **ๅๆN็ๆง่ดจ**๏ผ<br> - ๅฆๆNๆฏ็ด ๆฐ๏ผๅNไธๅจๅๅ่ฎพ็็ด ๆฐๅ่กจไธญ๏ผไธๅ่ฎพ็็พใ<br> - ๅฆๆNๆฏๅๆฐ๏ผๅๅญๅจๆไธช็ด ๆฐ $ p $ ๆด้คNใไฝ็ฑไบN้คไปฅไปปไฝ $ p_i $ ้ฝไฝ1๏ผๆ
$ p $ ไธๅจๅๅ่กจไธญ๏ผๅๆ ท็็พใ<br>4. **็ป่ฎบ**๏ผๅ ๆญค๏ผ็ด ๆฐๅฟ
้กปๆฏๆ ้็ใ<br>### ๆนๆณไบ๏ผ่ดน้ฉฌๆฐ็ๆง่ดจ<br>1. **ๅฎไน**๏ผ่ดน้ฉฌๆฐๅฝขๅฆ $ F_k = 2^{2^k} + 1 $๏ผๅ
ถไธญ $ k $ ไธบ้่ดๆดๆฐใ<br>2. **ๅ่ฎพ**๏ผๅ่ฎพ็ด ๆฐๆฏๆ้็๏ผไธๆๆ็ด ๆฐไธบ $ p_1, p_2, \\ldots, p_n $ใ<br>3. **ๆ้ ่ดน้ฉฌๆฐ**๏ผๅฏนไบๆฏไธช $ k $๏ผๆ้ $ F_k $ใๅฆๆ $ F_k $ ๆฏ็ด ๆฐ๏ผๅไธๅจๅๅ่กจไธญ๏ผๅฆๆๆฏๅๆฐ๏ผๅ
ถ็ด ๅ ๆฐไธๅจๅๅ่กจไธญใ<br>4. **็ป่ฎบ**๏ผๅ ๆญค๏ผ็ด ๆฐๅฟ
้กปๆฏๆ ้็ใ<br>### ๆนๆณไธ๏ผๆฌงๆๅฝๆฐไธ็ด ๆฐๆ ้ๆง<br>1. **ๆฌงๆๅฝๆฐ**๏ผๆฌงๆๅฝๆฐ $ \\phi(n) $ ่กจ็คบๅฐไบ $ n $ ไธไธ $ n $ ไบ่ดจ็ๆฐ็ไธชๆฐใ<br>2. **ๅ่ฎพ**๏ผๅ่ฎพ็ด ๆฐๆ้๏ผ่ฎฐไธบ $ p_1, p_2, \\ldots, p_n $ใ<br>3. **ๆ้ ๆฐ**๏ผ่่ๅฝขๅฆ $ N = p_1^{k_1} p_2^{k_2} \\ldots p_n^{k_n} $ ็ๆฐ๏ผๅ
ถๆฌงๆๅฝๆฐไธบ $ \\phi(N) = N \\prod_{i=1}^{n} \\left(1 - \\frac{1}{p_i}\\right) $ใ<br>4. **ๅๆ**๏ผๅฆๆ็ด ๆฐๆ้๏ผ$ \\prod_{p \\text{็ด ๆฐ}} \\left(1 - \\frac{1}{p}\\right) $ ๆถๆ๏ผไฝๅฎ้
ไธ่ฏฅ็งฏๅๆฃ๏ผๅฏผ่ด็็พใ<br>5. **็ป่ฎบ**๏ผๅ ๆญค๏ผ็ด ๆฐๅฟ
้กปๆฏๆ ้็ใ<br>่ฟไธ็งๆนๆณๅ่ชไปไธๅ็่งๅบฆ่ฏๆไบ็ด ๆฐ็ๆ ้ๆง๏ผๅฑ็คบไบๆฐ่ฎบไธญ็ด ๆฐๆ ้ๆง็ๆทฑๅปๆงใ | <br>์์๊ฐ ๋ฌดํํ๋ค๋ ๊ฒ์ 3๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์ฆ๋ช
ํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค:<br>1. **์ ํด๋ฆฌ๋์ ๋ชจ์ ์ฆ๋ช
**:<br> - **๊ฐ์ **: ์์๋ ์ ํํ ๊ฐ์ $ p_1, p_2, \\dots, p_n $์ด๋ผ๊ณ ๊ฐ์ ํฉ๋๋ค.<br> - **๊ตฌ์ฑ**: $ P = p_1 \\times p_2 \\times \\dots \\times p_n + 1 $์ผ๋ก ์ ์ํฉ๋๋ค.<br> - **๊ฒฐ๋ก **: $ P $๊ฐ ์์์ด๋ฉด, ๊ทธ๊ฒ์ ๋ชฉ๋ก์ ์๋ ์๋ก์ด ์์์
๋๋ค. ๋ง์ฝ $ P $๊ฐ ํฉ์ฑ์์ด๋ฉด, ๊ทธ๊ฒ์ ๋ชฉ๋ก์ ์๋ ์์๋ฅผ ํฌํจํด์ผ ํฉ๋๋ค. ๋ ๊ฒฝ์ฐ ๋ชจ๋ ๊ฐ์ ์ ๋ชจ์๋ฉ๋๋ค. ๋ฐ๋ผ์, ์์๋ ๋ฌดํํฉ๋๋ค.<br>2. **ํฉํ ๋ฆฌ์ผ ์ ๊ทผ๋ฒ**:<br> - **๊ฐ์ **: ์์๋ ์ ํํ ๊ฐ์ $ p_1, p_2, \\dots, p_n $์ด๋ผ๊ณ ๊ฐ์ ํฉ๋๋ค.<br> - **๊ตฌ์ฑ**: $ n! + 1 $์ ๊ณ ๋ คํ์ญ์์ค, ์ฌ๊ธฐ์ $ n $์ ๊ฐ์ฅ ํฐ ์์์
๋๋ค.<br> - **๊ฒฐ๋ก **: $ n! $์ ๋ชจ๋ $ p_i $๋ก ๋๋์ด ๋จ์ด์ง๋ฏ๋ก, $ n! + 1 $์ $ p_i $ ์ค ์ด๋ ๊ฒ๋ ํฌํจํ์ง ์์ต๋๋ค. ๋ง์ฝ $ n! + 1 $์ด ์์์ด๋ฉด, ๊ทธ๊ฒ์ $ n $๋ณด๋ค ํฐ ์๋ก์ด ์์์
๋๋ค. ๋ง์ฝ $ n! + 1 $์ด ํฉ์ฑ์์ด๋ฉด, ๊ทธ๊ฒ์ $ n $๋ณด๋ค ํฐ ์์๋ฅผ ํฌํจํด์ผ ํฉ๋๋ค. ๋ ๊ฒฝ์ฐ ๋ชจ๋ ๊ฐ์ ์ ๋ชจ์๋ฉ๋๋ค. ๋ฐ๋ผ์, ์์๋ ๋ฌดํํฉ๋๋ค.<br>3. **์ค์ผ๋ฌ์ ์ ํ ํจ์ ์ฆ๋ช
**:<br> - **๊ฐ๋
**: ์ค์ผ๋ฌ๋ ์ ํ ํจ์ $ \\zeta(s) = \\sum_{k=1}^\\infty \\frac{1}{k^s} $๊ฐ ์์์ ๋ํ ๊ณฑ์ผ๋ก ํํ๋ ์ ์์์ ๋ณด์์ต๋๋ค: $ \\zeta(s) = \\prod_{p \\text{ ์์}} \\frac{1}{1 - \\frac{1}{p^s}} $.<br> - **๊ฒฐ๋ก **: ๋ง์ฝ ์์๊ฐ ์ ํํ๋ฉด, ๊ณฑ์ ์ ํํด์ผ ํ ๊ฒ์
๋๏ฟฝ๏ฟฝ๏ฟฝ. ๊ทธ๋ฌ๋ $ s $๊ฐ 1๋ณด๋ค ํฐ ๊ฐ์ ํฅํด ์ ๊ทผํ ๋, $ \\zeta(s) $๋ ๋ฌดํ๋๋ก ๋ฐ์ฐํฉ๋๋ค. ์ด๊ฒ์ ๊ณฑ์ด ๋ฐ์ฐํด์ผ ํจ์ ์๊ตฌํ๋ฉฐ, ๋ฐ๋ผ์ ์์๋ ๋ฌดํํด์ผ ํฉ๋๋ค.<br>๊ฐ ๋ฐฉ๋ฒ์ ์์๊ฐ ๋ฌดํํ๋ค๋ ๊ฒ์ ํ์ฆํ๋ฉฐ, ์๋ก ๋ค๋ฅธ ์ํ์ ์์น์ ๊ธฐ๋ฐ์ ๋ก๋๋ค. ์ ํด๋ฆฌ๋์ ์ฆ๋ช
์ ๋ชจ์์ ์ฌ์ฉํฉ๋๋ค, ํฉํ ๋ฆฌ์ผ ์ ๊ทผ๋ฒ์ ๊ฐ๋จํ ์๋ก ์ ์ฌ์ฉํ๋ฉฐ, ์ค์ผ๋ฌ์ ์ฆ๋ช
์ ํด์์ ์๋ก ์ ๋๊ตฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ธ ๋ฐฉ๋ฒ ๋ชจ๋ ์์ ๋ฌดํ์ฑ์ ๋ํ ์ดํด๋ฅผ ๊ฐํํฉ๋๋ค. |
|
108 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
109 |
|
110 |
This code repository and the model weights are licensed under the MIT License.
|
111 |
DeepSeek-Bllossom series support commercial use, allow for any modifications and derivative works, including, but not limited to, distillation for training other LLMs. Please note that:
|
112 |
- **DeepSeek-R1-Distill-Llama-70B** is derived from Llama3.3-70B-Instruct and is originally licensed under llama3.3 license.
|
113 |
- **DeepSeek-llama3.3-Bllossom-70B** is derived from DeepSeek-R1-Distill-Llama-70B and is originally licensed under llama3.3 license.
|
114 |
|
115 |
-
##
|
116 |
- **UNIVA AI Team** ([UNIVA](https://univa.co.kr), Main contributor)
|
117 |
- ์ต์ฐฝ์ (์์ธ๊ณผํ๊ธฐ์ ๋ํ๊ต, [MLP์ฐ๊ตฌ์ค](https://sites.google.com/view/aailab) ์์ฌ๊ณผ์ )
|
118 |
- **์๊ฒฝํ** (KAIST, [MLP์ฐ๊ตฌ์ค](https://sites.google.com/view/aailab) ๊ต์)
|
119 |
|
120 |
-
##
|
121 |
If you have any questions, please raise an issue or contact us at [[email protected]]([email protected]).
|
|
|
105 |
| ------------- | ----------------------------- | -------------------------- |
|
106 |
| **Alice, Bob, Charlie๊ฐ 3ํ์ ๊ฒ์์์ ์ ์๋ฅผ ๋ฐ์์ต๋๋ค.<br>Alice์ ์ ์๋ Bob์ ์ ์์ ๋ ๋ฐฐ์ด๋ฉฐ, Bob์ ์ ์๋ Charlie์ 4๋ฐฐ์
๋๋ค.<br>Charlie๊ฐ 10์ ์ ๋ฐ์๋ค๋ฉด ์ด 3๋ช
์ ํ๊ท ์ ์๋ฅผ ๊ณ์ฐํ์ธ์.** |<br>Charlie์ ์ ์๋ 10์ ์
๋๋ค.<br>Bob์ ์ ์๋ Charlie์ 4๋ฐฐ์ด๋ฏ๋ก, Bob์ ์ ์๋ <br>$$<br>4 \\times 10 = 40<br>$$<br>์ ์
๋๋ค.<br>Alice์ ์ ์๋ Bob์ ์ ์์ ๋ ๋ฐฐ์ด๋ฏ๋ก, Alice์ ์ ์๋ <br>$$<br>2 \\times 40 = 80<br>$$<br>์ ์
๋๋ค.<br>์ธไบบ็ ์ด ์ ์๋ <br>$$<br>10 + 40 + 80 = 130<br>$$<br>์ ์
๋๋ค.<br>ํ๊ท ์ ์๋ <br>$$<br>\\frac{130}{3} \\approx 43.33$์ ์
๋๋ค.<br>$$<br>\\boxed{43.33}<br>$$<br>Charlie์ ์ ์๋ 10์ ์
๋๋ค. | <br>Charlie์ ์ ์๋ 10์ ์ผ๋ก ์ฃผ์ด์ก์ต๋๋ค. Bob์ ์ ์๋ Charlie์ ์ ์์ 4๋ฐฐ์ด๋ฉฐ, ์ด๋ ๋ค์๊ณผ ๊ฐ์ด ๊ณ์ฐ๋ฉ๋๋ค:<br>$$<br>4 \times 10 = 40<br>$$<br>Alice์ ์ ์๋ Bob์ ์ ์์ ๋ ๋ฐฐ์ด๋ฉฐ, ์ด๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:<br>$$<br>2 \times 40 = 80<br>$$<br>์ธ ์ฌ๋์ ์ด ์ ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค:<br>$$<br>10 + 40 + 80 = 130<br>$$<br>์ด ์ธ ์ฌ๋์ ํ๊ท ์ ์๋ ์ด ์ ์๋ฅผ ์ฌ๋ ์๋ก ๋๋์ด ๊ณ์ฐ๋ฉ๋๋ค:<br>$$<br>\frac{130}{3}<br>$$<br>๋ฐ๋ผ์, ์ด ์ธ ์ฌ๋์ ํ๊ท ์ ์๋ <br>$$<br>\boxed{\dfrac{130}{3}}<br>$$<br>์
๋๋ค. |
|
107 |
| **์์๊ฐ ๋ฌดํํ๋ค๋ ์ฌ์ค์ 3๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์ฆ๋ช
ํ์์ค.** | <br>ไปฅไธๆฏ็จไธ็งๆนๆณ่ฏๆ็ด ๆฐๆ ้็่ฏฆ็ปๆญฅ้ชค๏ผ<br>### ๆนๆณไธ๏ผๆฌงๅ ้ๅพ็ๅ่ฏๆณ<br>1. **ๅ่ฎพ**๏ผๅ่ฎพ็ด ๆฐๆฏๆ้็๏ผไธๆๆ็ด ๆฐไธบ $ p_1, p_2, p_3, \\ldots, p_n $ใ<br>2. **ๆ้ ๆฐ**๏ผๆ้ ไธไธชๆฐๆฐ $ N = (p_1 \\times p_2 \\times p_3 \\times \\ldots \\times p_n) + 1 $ใ<br>3. **ๅๆN็ๆง่ดจ**๏ผ<br> - ๅฆๆNๆฏ็ด ๆฐ๏ผๅNไธๅจๅๅ่ฎพ็็ด ๆฐๅ่กจไธญ๏ผไธๅ่ฎพ็็พใ<br> - ๅฆๆNๆฏๅๆฐ๏ผๅๅญๅจๆไธช็ด ๆฐ $ p $ ๆด้คNใไฝ็ฑไบN้คไปฅไปปไฝ $ p_i $ ้ฝไฝ1๏ผๆ
$ p $ ไธๅจๅๅ่กจไธญ๏ผๅๆ ท็็พใ<br>4. **็ป่ฎบ**๏ผๅ ๆญค๏ผ็ด ๆฐๅฟ
้กปๆฏๆ ้็ใ<br>### ๆนๆณไบ๏ผ่ดน้ฉฌๆฐ็ๆง่ดจ<br>1. **ๅฎไน**๏ผ่ดน้ฉฌๆฐๅฝขๅฆ $ F_k = 2^{2^k} + 1 $๏ผๅ
ถไธญ $ k $ ไธบ้่ดๆดๆฐใ<br>2. **ๅ่ฎพ**๏ผๅ่ฎพ็ด ๆฐๆฏๆ้็๏ผไธๆๆ็ด ๆฐไธบ $ p_1, p_2, \\ldots, p_n $ใ<br>3. **ๆ้ ่ดน้ฉฌๆฐ**๏ผๅฏนไบๆฏไธช $ k $๏ผๆ้ $ F_k $ใๅฆๆ $ F_k $ ๆฏ็ด ๆฐ๏ผๅไธๅจๅๅ่กจไธญ๏ผๅฆๆๆฏๅๆฐ๏ผๅ
ถ็ด ๅ ๆฐไธๅจๅๅ่กจไธญใ<br>4. **็ป่ฎบ**๏ผๅ ๆญค๏ผ็ด ๆฐๅฟ
้กปๆฏๆ ้็ใ<br>### ๆนๆณไธ๏ผๆฌงๆๅฝๆฐไธ็ด ๆฐๆ ้ๆง<br>1. **ๆฌงๆๅฝๆฐ**๏ผๆฌงๆๅฝๆฐ $ \\phi(n) $ ่กจ็คบๅฐไบ $ n $ ไธไธ $ n $ ไบ่ดจ็ๆฐ็ไธชๆฐใ<br>2. **ๅ่ฎพ**๏ผๅ่ฎพ็ด ๆฐๆ้๏ผ่ฎฐไธบ $ p_1, p_2, \\ldots, p_n $ใ<br>3. **ๆ้ ๆฐ**๏ผ่่ๅฝขๅฆ $ N = p_1^{k_1} p_2^{k_2} \\ldots p_n^{k_n} $ ็ๆฐ๏ผๅ
ถๆฌงๆๅฝๆฐไธบ $ \\phi(N) = N \\prod_{i=1}^{n} \\left(1 - \\frac{1}{p_i}\\right) $ใ<br>4. **ๅๆ**๏ผๅฆๆ็ด ๆฐๆ้๏ผ$ \\prod_{p \\text{็ด ๆฐ}} \\left(1 - \\frac{1}{p}\\right) $ ๆถๆ๏ผไฝๅฎ้
ไธ่ฏฅ็งฏๅๆฃ๏ผๅฏผ่ด็็พใ<br>5. **็ป่ฎบ**๏ผๅ ๆญค๏ผ็ด ๆฐๅฟ
้กปๆฏๆ ้็ใ<br>่ฟไธ็งๆนๆณๅ่ชไปไธๅ็่งๅบฆ่ฏๆไบ็ด ๆฐ็ๆ ้ๆง๏ผๅฑ็คบไบๆฐ่ฎบไธญ็ด ๆฐๆ ้ๆง็ๆทฑๅปๆงใ | <br>์์๊ฐ ๋ฌดํํ๋ค๋ ๊ฒ์ 3๊ฐ์ง ๋ฐฉ๋ฒ์ผ๋ก ์ฆ๋ช
ํ๊ธฐ ์ํด, ์ฐ๋ฆฌ๋ ๋ค์๊ณผ ๊ฐ์ ์ ๊ทผ ๋ฐฉ์์ ์ฌ์ฉํ ์ ์์ต๋๋ค:<br>1. **์ ํด๋ฆฌ๋์ ๋ชจ์ ์ฆ๋ช
**:<br> - **๊ฐ์ **: ์์๋ ์ ํํ ๊ฐ์ $ p_1, p_2, \\dots, p_n $์ด๋ผ๊ณ ๊ฐ์ ํฉ๋๋ค.<br> - **๊ตฌ์ฑ**: $ P = p_1 \\times p_2 \\times \\dots \\times p_n + 1 $์ผ๋ก ์ ์ํฉ๋๋ค.<br> - **๊ฒฐ๋ก **: $ P $๊ฐ ์์์ด๋ฉด, ๊ทธ๊ฒ์ ๋ชฉ๋ก์ ์๋ ์๋ก์ด ์์์
๋๋ค. ๋ง์ฝ $ P $๊ฐ ํฉ์ฑ์์ด๋ฉด, ๊ทธ๊ฒ์ ๋ชฉ๋ก์ ์๋ ์์๋ฅผ ํฌํจํด์ผ ํฉ๋๋ค. ๋ ๊ฒฝ์ฐ ๋ชจ๋ ๊ฐ์ ์ ๋ชจ์๋ฉ๋๋ค. ๋ฐ๋ผ์, ์์๋ ๋ฌดํํฉ๋๋ค.<br>2. **ํฉํ ๋ฆฌ์ผ ์ ๊ทผ๋ฒ**:<br> - **๊ฐ์ **: ์์๋ ์ ํํ ๊ฐ์ $ p_1, p_2, \\dots, p_n $์ด๋ผ๊ณ ๊ฐ์ ํฉ๋๋ค.<br> - **๊ตฌ์ฑ**: $ n! + 1 $์ ๊ณ ๋ คํ์ญ์์ค, ์ฌ๊ธฐ์ $ n $์ ๊ฐ์ฅ ํฐ ์์์
๋๋ค.<br> - **๊ฒฐ๋ก **: $ n! $์ ๋ชจ๋ $ p_i $๋ก ๋๋์ด ๋จ์ด์ง๋ฏ๋ก, $ n! + 1 $์ $ p_i $ ์ค ์ด๋ ๊ฒ๋ ํฌํจํ์ง ์์ต๋๋ค. ๋ง์ฝ $ n! + 1 $์ด ์์์ด๋ฉด, ๊ทธ๊ฒ์ $ n $๋ณด๋ค ํฐ ์๋ก์ด ์์์
๋๋ค. ๋ง์ฝ $ n! + 1 $์ด ํฉ์ฑ์์ด๋ฉด, ๊ทธ๊ฒ์ $ n $๋ณด๋ค ํฐ ์์๋ฅผ ํฌํจํด์ผ ํฉ๋๋ค. ๋ ๊ฒฝ์ฐ ๋ชจ๋ ๊ฐ์ ์ ๋ชจ์๋ฉ๋๋ค. ๋ฐ๋ผ์, ์์๋ ๋ฌดํํฉ๋๋ค.<br>3. **์ค์ผ๋ฌ์ ์ ํ ํจ์ ์ฆ๋ช
**:<br> - **๊ฐ๋
**: ์ค์ผ๋ฌ๋ ์ ํ ํจ์ $ \\zeta(s) = \\sum_{k=1}^\\infty \\frac{1}{k^s} $๊ฐ ์์์ ๋ํ ๊ณฑ์ผ๋ก ํํ๋ ์ ์์์ ๋ณด์์ต๋๋ค: $ \\zeta(s) = \\prod_{p \\text{ ์์}} \\frac{1}{1 - \\frac{1}{p^s}} $.<br> - **๊ฒฐ๋ก **: ๋ง์ฝ ์์๊ฐ ์ ํํ๋ฉด, ๊ณฑ์ ์ ํํด์ผ ํ ๊ฒ์
๋๏ฟฝ๏ฟฝ๏ฟฝ. ๊ทธ๋ฌ๋ $ s $๊ฐ 1๋ณด๋ค ํฐ ๊ฐ์ ํฅํด ์ ๊ทผํ ๋, $ \\zeta(s) $๋ ๋ฌดํ๋๋ก ๋ฐ์ฐํฉ๋๋ค. ์ด๊ฒ์ ๊ณฑ์ด ๋ฐ์ฐํด์ผ ํจ์ ์๊ตฌํ๋ฉฐ, ๋ฐ๋ผ์ ์์๋ ๋ฌดํํด์ผ ํฉ๋๋ค.<br>๊ฐ ๋ฐฉ๋ฒ์ ์์๊ฐ ๋ฌดํํ๋ค๋ ๊ฒ์ ํ์ฆํ๋ฉฐ, ์๋ก ๋ค๋ฅธ ์ํ์ ์์น์ ๊ธฐ๋ฐ์ ๋ก๋๋ค. ์ ํด๋ฆฌ๋์ ์ฆ๋ช
์ ๋ชจ์์ ์ฌ์ฉํฉ๋๋ค, ํฉํ ๋ฆฌ์ผ ์ ๊ทผ๋ฒ์ ๊ฐ๋จํ ์๋ก ์ ์ฌ์ฉํ๋ฉฐ, ์ค์ผ๋ฌ์ ์ฆ๋ช
์ ํด์์ ์๋ก ์ ๋๊ตฌ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ์ธ ๋ฐฉ๋ฒ ๋ชจ๋ ์์ ๋ฌดํ์ฑ์ ๋ํ ์ดํด๋ฅผ ๊ฐํํฉ๋๋ค. |
|
108 |
+
|
109 |
+
## 5. Benchmark
|
110 |
+
- dtype์ float16์ผ๋ก ์ถ๋ก ์ ์งํํ์์ต๋๋ค.
|
111 |
+
- max_tokens: 32786
|
112 |
+
- temperature: 0.7
|
113 |
+
- ํ๊ฐ ๋ฐฉ์: ๊ฐ ๋ฒค์น๋งํฌ๋ฅผ 3ํ ๋ฐ๋ณต ์คํํ ํ ํ๊ท ์ ์๋ฅผ ์ฐ์ถํ์์ต๋๋ค.
|
114 |
+
- _en ๋ฒค์น๋งํฌ: ์๋ณธ ๋ฒค์น๋งํฌ ์ง๋ฌธ์ ๊ทธ๋๋ก ์ฌ์ฉํ์์ต๋๋ค.
|
115 |
+
- _ko ๋ฒค์น๋งํฌ: ์๋ณธ ๋ฒค์น๋งํฌ ์ง๋ฌธ์ ํ๊ตญ์ด๋ก ๊ณ ํ์ง ๋ฒ์ญํ์ฌ ์ฌ์ฉํ์์ต๋๋ค.
|
116 |
+
-
|
117 |
+
| Model | AIME24_ko | AIME24_en | MATH500_ko | MATH500_en |
|
118 |
+
|---------------------------------------|-----------|-----------|------------|------------|
|
119 |
+
| DeepSeek-R1-Distill-Llama-8B | 25.56 | 46.67 | 63.40 | 88.87 |
|
120 |
+
| DeepSeek-llama3.1-Bllossom-8B | 36.67 | 40.00 | 78.07 | 87.80 |
|
121 |
+
| DeepSeek-R1-Distill-Llama-70B | 58.89 | 70.00 | 88.53 | 93.73 |
|
122 |
+
| DeepSeek-llama3.3-Bllossom-70B | 62.22 | 65.56 | 88.40 | 93.33 |
|
123 |
+
|
124 |
+
|
125 |
+
## 6. License
|
126 |
|
127 |
This code repository and the model weights are licensed under the MIT License.
|
128 |
DeepSeek-Bllossom series support commercial use, allow for any modifications and derivative works, including, but not limited to, distillation for training other LLMs. Please note that:
|
129 |
- **DeepSeek-R1-Distill-Llama-70B** is derived from Llama3.3-70B-Instruct and is originally licensed under llama3.3 license.
|
130 |
- **DeepSeek-llama3.3-Bllossom-70B** is derived from DeepSeek-R1-Distill-Llama-70B and is originally licensed under llama3.3 license.
|
131 |
|
132 |
+
## 7. Contributor
|
133 |
- **UNIVA AI Team** ([UNIVA](https://univa.co.kr), Main contributor)
|
134 |
- ์ต์ฐฝ์ (์์ธ๊ณผํ๊ธฐ์ ๋ํ๊ต, [MLP์ฐ๊ตฌ์ค](https://sites.google.com/view/aailab) ์์ฌ๊ณผ์ )
|
135 |
- **์๊ฒฝํ** (KAIST, [MLP์ฐ๊ตฌ์ค](https://sites.google.com/view/aailab) ๊ต์)
|
136 |
|
137 |
+
## 8. Contact
|
138 |
If you have any questions, please raise an issue or contact us at [[email protected]]([email protected]).
|