tahamajs
/

Qwen3-4b-gsm8k-Qlora-GRPO

Text Generation

Model card Files Files and versions

Qwen3-4b-gsm8k-Qlora-GRPO

Commit History

Update Readme

eea9430
verified

tahamajs commited on 20 days ago

Update Readme

54a0b75
verified

tahamajs commited on 20 days ago

Update README.md

8ed1b3f
verified

tahamajs commited on 20 days ago

add files

973c01d
verified

tahamajs commited on 21 days ago

Continue training: +5k steps on extra math data

f16a61e
verified

tahamajs commited on 22 days ago

initial commit

8e56fdd
verified

tahamajs commited on 22 days ago