研 究 追 踪 · LEADERBOARD MIRROR

大模型榜单镜像

关键评测榜单快照 · Artificial Analysis + LMArena
本页镜像第三方公开榜单,仅作研究参考。数据为快照,实时以各榜单官网为准。厂商以品牌色 + 标识区分。
数据截至 2026.07.01 · 更新节奏:周度更新 · 厂商以品牌色标识,归属标签 /

AA 综合智能指数

Artificial Analysis
官网 ↗
Intelligence Index v4.1(0–85,越高越强)2026-07-01 快照(72 小时滚动)

聚合 MMLU-Pro / GPQA / HLE / LiveCodeBench 等十余项基准的综合分,兼顾价格与速度,华尔街与产业界广泛引用。

#模型分数价格 / 备注
1/85 Claude Fable 5 (with fallback)Anthropic 60 $7.70/M · 1M ctx
2/85 Claude Opus 4.8 (max)Anthropic 56 $3.85/M · 62 t/s
3/85 GPT-5.5 (xhigh)OpenAI 55 $4.35/M · 922k
4/85 Claude Opus 4.7 (max)Anthropic 54 $3.85/M
5/85 Claude Sonnet 5 (max)Anthropic 53 $2.31/M
5/85 GPT-5.5 (high)OpenAI 53 $4.35/M
7/85 GLM-5.2 (max)智谱 Z.ai 51 $0.90/M · 开源最强
8/85 GPT-5.5 (medium)OpenAI 50 $4.35/M
8/85 Gemini 3.5 FlashGoogle 50 $1.31/M · 167 t/s
10/85 Claude Sonnet 4.6 (max)Anthropic 47 $2.31/M
11/85 Gemini 3.1 Pro PreviewGoogle 46 $1.74/M
11/85 Qwen3.7 Max阿里 Alibaba 46 $1.43/M · 199 t/s
13/85 MiniMax-M3MiniMax 44 $0.22/M · 开源第二
13/85 DeepSeek V4 Pro (max)DeepSeek 44 $0.18/M
15/85 Kimi K2.6月之暗面 Kimi 43 $0.70/M
16/85 MiMo-V2.5-Pro小米 Xiaomi 42 $0.18/M
16/85 Kimi K2.7 Code月之暗面 Kimi 42 $0.70/M
18/85 GLM-5.1智谱 Z.ai 40 $0.90/M
18/85 Grok Build 0.1xAI 40 $0.54/M
20/85 Qwen3.7 Plus阿里 Alibaba 39 $0.25/M
最佳开源:GLM-5.2 (max) 51 · 最便宜:Qwen3.5 0.8B $0.01/M · 最快:Mercury 2 918 t/s。共 85 个模型上榜,此处取 Top 20。

LMArena 文本竞技场

LMArena (原 Chatbot Arena)
官网 ↗
Arena Elo(数百万真实用户盲测偏好)2026-07-01 快照

UC Berkeley LMSYS 发起,基于真实用户盲测投票的 Elo 排名,最贴近真实使用偏好,业界公信力最高。全榜 298 个模型。

#模型Elo票数
1/298 Gemini 3.5 Flash / 3 ProGoogle 1490 27.8k 票
2/298 Grok 4.5xAI 1477 28.0k 票
3/298 Gemini 3.1 ProGoogle 1472 13.2k 票
4/298 Claude Opus 4.8 thinkingAnthropic 1470 19.9k 票
5/298 Claude Opus 4.7Anthropic 1467 21.2k 票
6/298 Grok 4.3xAI 1465 32.0k 票
7/298 Gemini 3 FlashGoogle 1462 9.6k 票
8/298 ERNIE 5.0百度 Baidu 1459 4.8k 票
9/298 GPT-5.5 highOpenAI 1458 24.4k 票
10/298 Gemini 3.5 Flash-LiteGoogle 1451 87.6k 票
11/298 Claude Sonnet 5Anthropic 1451 38.4k 票
12/298 ERNIE 5.0 Thinking百度 Baidu 1450 9.7k 票
13/298 Claude Opus 4.6Anthropic 1450 35.0k 票
19/298 GLM-5.2智谱 Z.ai 1441 9.6k 票 · 开源最高
23/298 Qwen3.7 Max阿里 Alibaba 1434 27.9k 票
26/298 Kimi K2.7月之暗面 Kimi 1429 26.1k 票
31/298 DeepSeek V4DeepSeek 1423 11.8k 票
65/298 MiMo-V2.5小米 Xiaomi 1395 9.3k 票
68/298 Hunyuan 3.0腾讯 Tencent 1393 2.2k 票
81/298 MiniMax-M3MiniMax 1382 8.7k 票
序号为在全榜 298 个模型中的真实名次(故国产模型会出现 65、81 等跳号,反映其全球实际位置,非连续 Top 20)。模型名以图形渲染无法抓取,依「排名+机构+公开信息」还原、仅供参考,完整榜单以官网为准。