codelion
/

gemma-3-1b-it-reasoning-grpo-lora

Text Generation

chain-of-thought

preference-learning

self-improvement

Model card Files Files and versions

gemma-3-1b-it-reasoning-grpo-lora / .gitattributes

Commit History

initial commit

7c83266
verified

codelion commited on Jul 17