benchang1110 commited on
Commit
20fc8d2
·
verified ·
1 Parent(s): 0e0919d

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +7 -8
README.md CHANGED
@@ -25,14 +25,6 @@ library_name: transformers
25
  **注意**: 此模型的 tokenizer 和 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 是相同的 (經過簡繁轉換),和 [benchang1110/Qwen2.5-Taiwan-3B-Instruct](https://huggingface.co/benchang1110/Qwen2.5-Taiwan-3B-Instruct)不同。
26
  若要生成簡體中文,可以直接使用 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 的 tokenizer 即可。
27
 
28
- ### Choosing MATH Related Problems
29
-
30
- 我們直接看 repo_name 是否與數學相關:
31
-
32
- ```python
33
- dataset = load_dataset('benchang1110/Chinese-DeepSeek-R1-Distill-data-110k-opencc', split='train')
34
- dataset = dataset1.filter(lambda x: 'math' in x['repo_name'].lower())
35
- ```
36
 
37
  ## Model Description
38
 
@@ -61,6 +53,13 @@ GPU Hours: A100*15h
61
 
62
  ![REASON_SFT_3B.png](REASON_SFT_3B.png)
63
 
 
 
 
 
 
 
 
64
  ## Uses
65
 
66
  此模型能用來回答數學問題,```<think>``` 已經加在 chat template 當中。
 
25
  **注意**: 此模型的 tokenizer 和 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 是相同的 (經過簡繁轉換),和 [benchang1110/Qwen2.5-Taiwan-3B-Instruct](https://huggingface.co/benchang1110/Qwen2.5-Taiwan-3B-Instruct)不同。
26
  若要生成簡體中文,可以直接使用 [deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B) 的 tokenizer 即可。
27
 
 
 
 
 
 
 
 
 
28
 
29
  ## Model Description
30
 
 
53
 
54
  ![REASON_SFT_3B.png](REASON_SFT_3B.png)
55
 
56
+ 使用數學資料集微調
57
+
58
+ ```python
59
+ dataset = load_dataset('benchang1110/Chinese-DeepSeek-R1-Distill-data-110k-opencc', split='train')
60
+ dataset = dataset1.filter(lambda x: 'math' in x['repo_name'].lower())
61
+ ```
62
+
63
  ## Uses
64
 
65
  此模型能用來回答數學問題,```<think>``` 已經加在 chat template 當中。