codelion
/

gemma-3-1b-it-reasoning-grpo-lora

Text Generation

chain-of-thought

preference-learning

self-improvement

Model card Files Files and versions

gemma-3-1b-it-reasoning-grpo-lora

Ctrl+K

Ctrl+K

1 contributor

History: 6 commits

codelion's picture

Upload model

0ebb621 verified about 1 month ago