Leaderboards - a smcleod Collection

smcleod 's Collections

Leaderboards

updated Oct 27, 2024

My collection of leaderboards

Running on CPU Upgrade

13.3k

13.3k

Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots
Running

4.52k

4.52k

Chatbot Arena Leaderboard

🏆

View chatbot performance leaderboard
Running

445

445

Can Ai Code Results

🏆

Can AI Code? An LLM leaderboard inclquantized models.
Running on CPU Upgrade

819

819

Open VLM Leaderboard

🌎

VLMEvalKit Evaluation Results Collection
Running

215

215

BigCodeBench Leaderboard

🥇

Explore and analyze code evaluation data
Running

531

531

LLM-Perf Leaderboard

🏆

Explore LLM performance across hardware
Running on CPU Upgrade

919

919

Open ASR Leaderboard

🏆

Request evaluation for a speech model
Running on CPU Upgrade

6.02k

6.02k

MTEB Leaderboard

🥇

Embedding Leaderboard
Running

4

4

OSQ Leaderboard

🐨

Display leaderboard data for LLMs
Running

53

53

NPHardEval Leaderboard

🥇

Explore and compare LLM models through a leaderboard
Running

67

67

CyberSecEvalTest

📈

Evaluate LLM cybersecurity risks
Running

11

11

Q-Bench+ Leaderboard

📊

Browse Q-Bench leaderboard for vision model performance
Running on CPU Upgrade

151

151

LLM Hallucination Leaderboard

🚀

Generate interactive React app data visualizations
Running

34

34

Leaderboard

🐠
Running

87

87

Zebra Logic Bench

🦓

Render a leaderboard for model evaluation
Running

111

111

Open VLM Video Leaderboard

🌎

VLMEvalKit Eval Results in video understanding benchmark