leaderboards - a fpreiss Collection

fpreiss 's Collections

papers-context-length

papers-efficiency

papers-reasoning

leaderboards

updated Jul 1, 2024

Running

187

187

Yet Another LLM Leaderboard

🌖

Run a Streamlit web app
Running on CPU Upgrade

50

50

Open CoT Leaderboard

🥇

Track, rank and evaluate open LLMs' CoT quality
Running on CPU Upgrade

12.6k

12.6k

Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots
Runtime error

4.11k

4.11k

Chatbot Arena Leaderboard

🏆

Display chatbot leaderboard statistics
Runtime error

22

22

Yet Another LLM Leaderboard

🌖
Running

434

434

Can Ai Code Results

🏆

Generate animated avatars from images
Running on CPU Upgrade

4.92k

4.92k

MTEB Leaderboard

🥇

Select benchmarks and languages for text embeddings evaluation
Running on CPU Upgrade

643

643

Open VLM Leaderboard

🌎

VLMEvalKit Evaluation Results Collection
Running

65

65

Toolbench Leaderboard

⚡

Display ToolBench model performance results
Runtime error

29

29

Open RL Leaderboard

🥇
Configuration error

34

34

Leaderboard

🐠
Running on CPU Upgrade

286

286

GAIA Leaderboard

🦾

Submit and evaluate text-based models
Running

8

8

Paper-LeaderBoard

📖

Read top papers
Running

287

287

LLM Performance Leaderboard

🐨

View LLM Performance Leaderboard
Runtime error

29

29

Open LLM Leaderboard for domains

📊

Ranking for Open-sourced LLMs in different domains
Running on CPU Upgrade

147

147

Open LLM Progress Tracker

🔬

Visualize Open vs. Proprietary LLM Progress
Running

85

85

imgsys.org

📊

imgsys.org -- arena for text guided image generation
Running

1.17k

1.17k

Big Code Models Leaderboard

📈

Submit code models for evaluation on benchmarks
Running

431

431

LLM-Perf Leaderboard

🏆

Explore LLM performance across hardware
Running

341

341

Reward Bench Leaderboard

📐

Explore and analyze RewardBench leaderboard data
Running on CPU Upgrade

628

628

Open ASR Leaderboard

🏆

Request evaluation for speech models
Running

164

164

Low-bit Quantized Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots
Running on CPU Upgrade

79

79

Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots