OsakanaTeishoku
/

sarashina2.2-3b-instruct-v0.1-grpo-exp-v0.1

Text Generation

text-generation-inference

Model card Files Files and versions

sarashina2.2-3b-instruct-v0.1-grpo-exp-v0.1

Commit History

Update README.md

48ac3ac
verified

OsakanaTeishoku commited on Mar 7

Update README.md

742f5f5
verified

OsakanaTeishoku commited on Mar 7

Update README.md

4dda42b
verified

OsakanaTeishoku commited on Mar 7

Update README.md

3084f78
verified

OsakanaTeishoku commited on Mar 7

Trained with Unsloth

7a9f53f
verified

OsakanaTeishoku commited on Mar 7

Upload tokenizer

fb1b428
verified

OsakanaTeishoku commited on Mar 7

Upload README.md with huggingface_hub

4e436bb
verified

OsakanaTeishoku commited on Mar 7

initial commit

0dfe4b9
verified

OsakanaTeishoku commited on Mar 7