benchang1110
/

Qwen2.5-Taiwan-1.5B-Instruct

@@ -6,7 +6,6 @@ language:
 - zh
 - en
 base_model:
-- microsoft/Phi-4-multimodal-instruct
 - Qwen/Qwen2.5-1.5B-Instruct
 pipeline_tag: text-generation
 library_name: transformers
@@ -23,7 +22,7 @@ license: apache-2.0
 因為簡體中文和繁體中文在語法和語義相似度高，往往只是差在文字本身看起來不一樣。另外，千問 (Qwen) 的模型中文的能力是很強的 (甚至是 apache license)。我們利用 [繁化姬](https://zhconvert.org) 將簡體中文所對應的 token 和 繁體中文的 token 做代換。更多關於 tokenizer 帶換掉哪些單詞，可以查看 [benchang1110/DeepSeek-R1-Distill-Qwen-1.5B-zhtw](https://huggingface.co/benchang1110/DeepSeek-R1-Distill-Qwen-1.5B-zhtw) 中的 convert.txt。
 ### SFT
-這個階段我們用 [lianghsun/tw-instruct-500k](https://huggingface.co/datasets/lianghsun/tw-instruct-500k) 這個資料集做微調，目標讓模型知道一點台灣的在地文化和一些台灣常用的慣用語，但為了保持模型原先強大的性能，我們用 LoRA 微調。
 ### DPO
 這個階段我們用 [zake7749/kyara-chinese-preference-rl-dpo-s0-30K](https://huggingface.co/datasets/zake7749/kyara-chinese-preference-rl-dpo-s0-30K) 這個資料集做 alignment，目標讓模型能夠條列式的輸出，並且能夠在輸出的時候保持一定的邏輯性。
@@ -144,7 +143,6 @@ ASSISTANT：當然可以。在18世紀，音樂風格經歷了許多變化，從
 修改 system prompt 會調整模型輸出的偏見和立場。
 ## How to Get Started with the Model
 使用下面程式碼可以進行多輪對話，使用 ```restart``` 可以重新開始對話，使用 ```exit``` 可以結束對話。```system``` 是 system prompt 對於模型的輸出影響很大。Default 的 system prompt 是 ```"你是 Qwen-Taiwan-1.5B, 來自台灣，全名福爾摩沙台灣。你是一位有幫助的助手。"```。
@@ -371,7 +369,6 @@ GPU Hours: A100*3h
 ## Citation
 ```bibtex

 - zh
 - en
 base_model:
 - Qwen/Qwen2.5-1.5B-Instruct
 pipeline_tag: text-generation
 library_name: transformers
 因為簡體中文和繁體中文在語法和語義相似度高，往往只是差在文字本身看起來不一樣。另外，千問 (Qwen) 的模型中文的能力是很強的 (甚至是 apache license)。我們利用 [繁化姬](https://zhconvert.org) 將簡體中文所對應的 token 和 繁體中文的 token 做代換。更多關於 tokenizer 帶換掉哪些單詞，可以查看 [benchang1110/DeepSeek-R1-Distill-Qwen-1.5B-zhtw](https://huggingface.co/benchang1110/DeepSeek-R1-Distill-Qwen-1.5B-zhtw) 中的 convert.txt。
 ### SFT
+這個階段我們用 [lianghsun/tw-instruct-500k](https://huggingface.co/datasets/lianghsun/tw-instruct-500k) 因為前面的繁簡轉換並無法轉換所有單詞，所以用這個資料集做微調。但為了保持模型原先強大的性能避免更改太多模型參數，我們用 LoRA 微調。
 ### DPO
 這個階段我們用 [zake7749/kyara-chinese-preference-rl-dpo-s0-30K](https://huggingface.co/datasets/zake7749/kyara-chinese-preference-rl-dpo-s0-30K) 這個資料集做 alignment，目標讓模型能夠條列式的輸出，並且能夠在輸出的時候保持一定的邏輯性。
 修改 system prompt 會調整模型輸出的偏見和立場。
 ## How to Get Started with the Model
 使用下面程式碼可以進行多輪對話，使用 ```restart``` 可以重新開始對話，使用 ```exit``` 可以結束對話。```system``` 是 system prompt 對於模型的輸出影響很大。Default 的 system prompt 是 ```"你是 Qwen-Taiwan-1.5B, 來自台灣，全名福爾摩沙台灣。你是一位有幫助的助手。"```。
 ## Citation
 ```bibtex