benchmarks - a SaylorTwift Collection

SaylorTwift 's Collections

RULER Datasets Falcon-H1-3B-Base

RULER Datasets Lamma3-Instruct

RULER Datasets Qwen2.5-Instruct

RULER Datasets Qwen-3-Instruct

RULER Datasets Qwen-3

Agents ressources

benchmarks

updated 4 days ago