ermiaazarkhalili
/

llama-3.1-8b-instruct_grpo-GSM8K

Text Generation

text-generation-inference

Model card Files Files and versions

llama-3.1-8b-instruct_grpo-GSM8K / model-00001-of-00004.safetensors

Commit History

(Trained with Unsloth)

f3e4edf
verified

ermiaazarkhalili commited on 13 days ago