ermiaazarkhalili
/

llama-3.2-1b-instruct_grpo-GSM8K

Text Generation

text-generation-inference

Model card Files Files and versions

llama-3.2-1b-instruct_grpo-GSM8K / model.safetensors

Commit History

(Trained with Unsloth)

4d3c38d
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

d94cc90
verified

ermiaazarkhalili commited on Jun 13