sonyashijin
/

Qwen-2-5-7b-RTL-GRPO_LoRA

text-generation-inference

Model card Files Files and versions Community

Qwen-2-5-7b-RTL-GRPO_LoRA

Commit History

Upload model trained with Unsloth

5054d78
verified

sonyashijin commited on May 23

Upload model trained with Unsloth

d1ac694
verified

sonyashijin commited on May 23

Upload README.md with huggingface_hub

58d300a
verified

sonyashijin commited on May 23

initial commit

4562a59
verified

sonyashijin commited on May 23