rasdani
/

Qwen2.5-7B-Instruct-GRPO-unsloth

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-7B-Instruct-GRPO-unsloth

Commit History

Trained with Unsloth

2c982cc
verified

rasdani commited on 2 days ago

Trained with Unsloth

8dd25ef
verified

rasdani commited on 5 days ago

Upload tokenizer

b57f2cb
verified

rasdani commited on 5 days ago

Upload README.md with huggingface_hub

e411ae4
verified

rasdani commited on 5 days ago

initial commit

b6923e6
verified

rasdani commited on 5 days ago