LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
9.76k
•
87
Viewer
•
Updated
•
164
•
78.5k
•
271
Viewer
•
Updated
•
541
•
12.6k
•
54
Viewer
•
Updated
•
7.79k
•
230k
•
165
Updated
•
132k
•
60
Viewer
•
Updated
•
12.1k
•
44.7k
•
315
Viewer
•
Updated
•
231k
•
134k
•
384
Viewer
•
Updated
•
1.63k
•
34.9k
•
220
Viewer
•
Updated
•
17.6k
•
257k
•
560
Viewer
•
Updated
•
60k
•
199k
•
106
Updated
•
33.6k
•
53
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
130
•
16
Viewer
•
Updated
•
34.6k
•
1.82k
•
108
Viewer
•
Updated
•
95.4k
•
3.11k
•
36