jlchen-c
/

Qwen-2.5-7B-Simple-RL

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-7B-Simple-RL / eval /results

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

jlchen-c's picture

Model save

c12f85b verified 4 months ago

data_exp_Qwen-2.5-7B-LoRA-r256a512-Simple-RL_mpl1024-mcl1024
Model save 4 months ago