聚合 MMLU-Pro / GPQA / HLE / LiveCodeBench 等十余项基准的综合分,兼顾价格与速度,华尔街与产业界广泛引用。
| # | 模型 | 分数 | 价格 / 备注 |
|---|---|---|---|
| 1/85 | ✳Claude Fable 5 (with fallback)Anthropic美 | 60 | $7.70/M · 1M ctx |
| 2/85 | ✳Claude Opus 4.8 (max)Anthropic美 | 56 | $3.85/M · 62 t/s |
| 3/85 | ◉GPT-5.5 (xhigh)OpenAI美 | 55 | $4.35/M · 922k |
| 4/85 | ✳Claude Opus 4.7 (max)Anthropic美 | 54 | $3.85/M |
| 5/85 | ✳Claude Sonnet 5 (max)Anthropic美 | 53 | $2.31/M |
| 5/85 | ◉GPT-5.5 (high)OpenAI美 | 53 | $4.35/M |
| 7/85 | 智GLM-5.2 (max)智谱 Z.ai中 | 51 | $0.90/M · 开源最强 |
| 8/85 | ◉GPT-5.5 (medium)OpenAI美 | 50 | $4.35/M |
| 8/85 | ◆Gemini 3.5 FlashGoogle美 | 50 | $1.31/M · 167 t/s |
| 10/85 | ✳Claude Sonnet 4.6 (max)Anthropic美 | 47 | $2.31/M |
| 11/85 | ◆Gemini 3.1 Pro PreviewGoogle美 | 46 | $1.74/M |
| 11/85 | 通Qwen3.7 Max阿里 Alibaba中 | 46 | $1.43/M · 199 t/s |
| 13/85 | MMiniMax-M3MiniMax中 | 44 | $0.22/M · 开源第二 |
| 13/85 | 深DeepSeek V4 Pro (max)DeepSeek中 | 44 | $0.18/M |
| 15/85 | KKimi K2.6月之暗面 Kimi中 | 43 | $0.70/M |
| 16/85 | 米MiMo-V2.5-Pro小米 Xiaomi中 | 42 | $0.18/M |
| 16/85 | KKimi K2.7 Code月之暗面 Kimi中 | 42 | $0.70/M |
| 18/85 | 智GLM-5.1智谱 Z.ai中 | 40 | $0.90/M |
| 18/85 | ✕Grok Build 0.1xAI美 | 40 | $0.54/M |
| 20/85 | 通Qwen3.7 Plus阿里 Alibaba中 | 39 | $0.25/M |
UC Berkeley LMSYS 发起,基于真实用户盲测投票的 Elo 排名,最贴近真实使用偏好,业界公信力最高。全榜 298 个模型。
| # | 模型 | Elo | 票数 |
|---|---|---|---|
| 1/298 | ◆Gemini 3.5 Flash / 3 ProGoogle美 | 1490 | 27.8k 票 |
| 2/298 | ✕Grok 4.5xAI美 | 1477 | 28.0k 票 |
| 3/298 | ◆Gemini 3.1 ProGoogle美 | 1472 | 13.2k 票 |
| 4/298 | ✳Claude Opus 4.8 thinkingAnthropic美 | 1470 | 19.9k 票 |
| 5/298 | ✳Claude Opus 4.7Anthropic美 | 1467 | 21.2k 票 |
| 6/298 | ✕Grok 4.3xAI美 | 1465 | 32.0k 票 |
| 7/298 | ◆Gemini 3 FlashGoogle美 | 1462 | 9.6k 票 |
| 8/298 | 度ERNIE 5.0百度 Baidu中 | 1459 | 4.8k 票 |
| 9/298 | ◉GPT-5.5 highOpenAI美 | 1458 | 24.4k 票 |
| 10/298 | ◆Gemini 3.5 Flash-LiteGoogle美 | 1451 | 87.6k 票 |
| 11/298 | ✳Claude Sonnet 5Anthropic美 | 1451 | 38.4k 票 |
| 12/298 | 度ERNIE 5.0 Thinking百度 Baidu中 | 1450 | 9.7k 票 |
| 13/298 | ✳Claude Opus 4.6Anthropic美 | 1450 | 35.0k 票 |
| 19/298 | 智GLM-5.2智谱 Z.ai中 | 1441 | 9.6k 票 · 开源最高 |
| 23/298 | 通Qwen3.7 Max阿里 Alibaba中 | 1434 | 27.9k 票 |
| 26/298 | KKimi K2.7月之暗面 Kimi中 | 1429 | 26.1k 票 |
| 31/298 | 深DeepSeek V4DeepSeek中 | 1423 | 11.8k 票 |
| 65/298 | 米MiMo-V2.5小米 Xiaomi中 | 1395 | 9.3k 票 |
| 68/298 | 混Hunyuan 3.0腾讯 Tencent中 | 1393 | 2.2k 票 |
| 81/298 | MMiniMax-M3MiniMax中 | 1382 | 8.7k 票 |