rasdani
/

Qwen2.5-1.5B-Instruct-GRPO-rg

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Instruct-GRPO-rg

Commit History

Trained with Unsloth

227e0c0
verified

rasdani commited on 8 days ago

Trained with Unsloth

e39dcf1
verified

rasdani commited on 9 days ago

Trained with Unsloth

e6acf94
verified

rasdani commited on 10 days ago

Trained with Unsloth

d22f91b
verified

rasdani commited on 10 days ago

Trained with Unsloth

669de83
verified

rasdani commited on 10 days ago

Trained with Unsloth

ef53c90
verified

rasdani commited on 10 days ago

Upload tokenizer

5e02c6f
verified

rasdani commited on 10 days ago

Upload README.md with huggingface_hub

6c2fcc0
verified

rasdani commited on 10 days ago

initial commit

41acfb8
verified

rasdani commited on 10 days ago