rasdani
/

Qwen2.5-1.5B-Instruct-GRPO-rg

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Instruct-GRPO-rg / model.safetensors

Commit History

Trained with Unsloth

227e0c0
verified

rasdani commited on 8 days ago

Trained with Unsloth

e39dcf1
verified

rasdani commited on 9 days ago

Trained with Unsloth

e6acf94
verified

rasdani commited on 10 days ago

Trained with Unsloth

669de83
verified

rasdani commited on 10 days ago

Trained with Unsloth

ef53c90
verified

rasdani commited on 10 days ago