ermiaazarkhalili
/

llama-3.1-8b-instruct_grpo-GSM8K

Text Generation

text-generation-inference

Model card Files Files and versions

llama-3.1-8b-instruct_grpo-GSM8K

Commit History

Update README.md

066bdb8
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

4344895
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

42923cf
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

436bf09
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

f3e4edf
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

61191ea
verified

ermiaazarkhalili commited on 13 days ago

(Trained with Unsloth)

c064368
verified

ermiaazarkhalili commited on 13 days ago

Unsloth Model Card

3118e59
verified

ermiaazarkhalili commited on 13 days ago

initial commit

03b0ba3
verified

ermiaazarkhalili commited on 13 days ago