Haitao999
/

Llama-3.2-3B-Instruct-GRPO-numia_prompt_dpo1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-GRPO-numia_prompt_dpo1 / training_args.bin

Commit History

Training in progress, step 60

3a18c8b
verified

Haitao999 commited on 21 days ago

Training in progress, step 10

1bab43d
verified

Haitao999 commited on 21 days ago

Training in progress, step 10

39b8a25
verified

Haitao999 commited on 22 days ago