Haitao999
/

Llama-3.1-8B-Instruct-GRPO-numia_prompt_dpo1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.1-8B-Instruct-GRPO-numia_prompt_dpo1 / training_args.bin

Commit History

Training in progress, step 10

7af001d
verified

Haitao999 commited on 16 days ago

Training in progress, step 10

1f84bf1
verified

Haitao999 commited on 16 days ago