SWY666
/

Qwen-2.5-7B-Simple-RL-with-reward-model

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-Simple-RL-with-reward-model

Commit History

End of training

619991a
verified

SWY666 commited on Feb 19

Model save

cf0866a
verified

SWY666 commited on Feb 19

initial commit

4632670
verified

SWY666 commited on Feb 19