rasdani
/

Qwen2.5-3B-Instruct-GRPO-unsloth

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GRPO-unsloth / model-00002-of-00002.safetensors

Commit History

Trained with Unsloth

cd34c36
verified

rasdani commited on 3 days ago

Trained with Unsloth

9dd6297
verified

rasdani commited on 11 days ago

Trained with Unsloth

a37b00e
verified

rasdani commited on 11 days ago

Trained with Unsloth

e364b56
verified

rasdani commited on 11 days ago