tahamajs
/

Qwen3-4b-gsm8k-Qlora-GRPO

Text Generation

Model card Files Files and versions

Qwen3-4b-gsm8k-Qlora-GRPO / tokenizer.json

Commit History

add files

973c01d
verified

tahamajs commited on 22 days ago

Continue training: +5k steps on extra math data

f16a61e
verified

tahamajs commited on 23 days ago