rasdani
/

Qwen2.5-3B-Instruct-GRPO-unsloth

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-3B-Instruct-GRPO-unsloth

Commit History

Trained with Unsloth

cd34c36
verified

rasdani commited on 3 days ago

Upload tokenizer

bd34965
verified

rasdani commited on 3 days ago

Trained with Unsloth

9dd6297
verified

rasdani commited on 10 days ago

Upload tokenizer

da942a5
verified

rasdani commited on 10 days ago

Trained with Unsloth

a37b00e
verified

rasdani commited on 11 days ago

Trained with Unsloth

e364b56
verified

rasdani commited on 11 days ago

Upload tokenizer

12f9858
verified

rasdani commited on 11 days ago

Upload README.md with huggingface_hub

4c1a845
verified

rasdani commited on 11 days ago

initial commit

71718ee
verified

rasdani commited on 11 days ago