Haitao999
/

Llama-3.2-3B-Instruct-GRPO-numia_prompt_dpo1

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Llama-3.2-3B-Instruct-GRPO-numia_prompt_dpo1 / tokenizer.json

Commit History

Training in progress, step 10

39b8a25
verified

Haitao999 commited on 21 days ago