codelion
/

gemma-3-1b-it-reasoning-grpo-lora

Text Generation

chain-of-thought

preference-learning

self-improvement

Model card Files Files and versions

gemma-3-1b-it-reasoning-grpo-lora

Ctrl+K

Ctrl+K

1 contributor

History: 1 commit

codelion's picture

initial commit

7c83266 verified about 1 month ago

.gitattributes

1.52 kB

initial commit about 1 month ago