chunli-peng
/

OpenRS-GRPO-sft

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

OpenRS-GRPO-sft

Commit History

End of training

78d1558
verified

chunli-peng commited on 6 days ago

Model save

14a99d2
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 9

c595af4
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 9

51668ea
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 8

72f9420
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 7

7aa833e
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 6

8ebe5d4
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 5

b562ad0
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 4

c9d7741
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 3

8352a14
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 2

c7b5a92
verified

chunli-peng commited on 6 days ago

Training in progress, epoch 1

3a123e8
verified

chunli-peng commited on 6 days ago

initial commit

8952775
verified

chunli-peng commited on 6 days ago