HallOumi GRPO - a TEEN-D Collection

Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

TEEN-D 's Collections

Reinforcement Learning

HallOumi GRPO

updated Apr 24

HallOumi training data prepared for a GRPO trainer.

TEEN-D/grpo-oumi-anli-subset

Viewer • Updated Apr 25 • 21.1k • 35
TEEN-D/grpo-oumi-c2d-d2c-subset

Viewer • Updated Apr 24 • 14.4k • 36
TEEN-D/grpo-oumi-synthetic-claims

Viewer • Updated Apr 24 • 19.2k • 38
TEEN-D/grpo-oumi-synthetic-document-claims

Viewer • Updated Apr 24 • 8.4k • 44

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs