mlxha
/

Qwen3-4B-grpo-medmcqa

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

Qwen3-4B-grpo-medmcqa / .wandb_run_id

Commit History

Training in progress, step 300

9e3a888
verified

mlxha commited on May 8