rasdani
/

Qwen-7B-Instruct-GRPO-unsloth

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen-7B-Instruct-GRPO-unsloth

Commit History

Trained with Unsloth

f0b4e07
verified

rasdani commited on 6 days ago

Upload tokenizer

4198b3e
verified

rasdani commited on 6 days ago

Upload README.md with huggingface_hub

93eb6dd
verified

rasdani commited on 6 days ago

initial commit

6046182
verified

rasdani commited on 6 days ago