haihp02
/

Qwen3-4B-Base-082907de-7165-4f64-8106-82d56adb58af-dpo-tuned-merged

Text Generation

text-generation-inference

Model card Files Files and versions Community

Qwen3-4B-Base-082907de-7165-4f64-8106-82d56adb58af-dpo-tuned-merged

Commit History

Trained with Unsloth

ad0b7c2
verified

haihp02 commited on 25 days ago

Upload tokenizer

df7f50e
verified

haihp02 commited on 25 days ago

Upload README.md with huggingface_hub

59877d7
verified

haihp02 commited on 25 days ago

initial commit

ed3e3e5
verified

haihp02 commited on 25 days ago