Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -24,7 +24,7 @@ base_model:
 - Qwen/Qwen2.5-3B-Instruct
 ---
-# Qwen-2.5-3B-CoT-ZH-TW (GRPO RLHF 啟發式多步推理優化版)
 ---

 - Qwen/Qwen2.5-3B-Instruct
 ---
+# Qwen-2.5-3B-CoT-ZH-TW (GRPO)
 ---