Update README.md
Browse files
README.md
CHANGED
@@ -25,14 +25,6 @@ library_name: transformers
|
|
25 |
**注意**: 此模型的 tokenizer 和 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 是相同的 (經過簡繁轉換),和 [benchang1110/Qwen2.5-Taiwan-3B-Instruct](https://huggingface.co/benchang1110/Qwen2.5-Taiwan-3B-Instruct)不同。
|
26 |
若要生成簡體中文,可以直接使用 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 的 tokenizer 即可。
|
27 |
|
28 |
-
### Choosing MATH Related Problems
|
29 |
-
|
30 |
-
我們直接看 repo_name 是否與數學相關:
|
31 |
-
|
32 |
-
```python
|
33 |
-
dataset = load_dataset('benchang1110/Chinese-DeepSeek-R1-Distill-data-110k-opencc', split='train')
|
34 |
-
dataset = dataset1.filter(lambda x: 'math' in x['repo_name'].lower())
|
35 |
-
```
|
36 |
|
37 |
## Model Description
|
38 |
|
@@ -61,6 +53,13 @@ GPU Hours: A100*15h
|
|
61 |
|
62 |

|
63 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
64 |
## Uses
|
65 |
|
66 |
此模型能用來回答數學問題,```<think>``` 已經加在 chat template 當中。
|
|
|
25 |
**注意**: 此模型的 tokenizer 和 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 是相同的 (經過簡繁轉換),和 [benchang1110/Qwen2.5-Taiwan-3B-Instruct](https://huggingface.co/benchang1110/Qwen2.5-Taiwan-3B-Instruct)不同。
|
26 |
若要生成簡體中文,可以直接使用 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 的 tokenizer 即可。
|
27 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
28 |
|
29 |
## Model Description
|
30 |
|
|
|
53 |
|
54 |

|
55 |
|
56 |
+
使用數學資料集微調
|
57 |
+
|
58 |
+
```python
|
59 |
+
dataset = load_dataset('benchang1110/Chinese-DeepSeek-R1-Distill-data-110k-opencc', split='train')
|
60 |
+
dataset = dataset1.filter(lambda x: 'math' in x['repo_name'].lower())
|
61 |
+
```
|
62 |
+
|
63 |
## Uses
|
64 |
|
65 |
此模型能用來回答數學問題,```<think>``` 已經加在 chat template 當中。
|