大模型榜单镜像

AA 综合智能指数

Artificial Analysis

Intelligence Index v4.1（0–85，越高越强）2026-07-01 快照（72 小时滚动）

聚合 MMLU-Pro / GPQA / HLE / LiveCodeBench 等十余项基准的综合分，兼顾价格与速度，华尔街与产业界广泛引用。

#	模型	分数	价格 / 备注
1/85	✳Claude Fable 5 (with fallback)Anthropic美	60	$7.70/M · 1M ctx
2/85	✳Claude Opus 4.8 (max)Anthropic美	56	$3.85/M · 62 t/s
3/85	◉GPT-5.5 (xhigh)OpenAI美	55	$4.35/M · 922k
4/85	✳Claude Opus 4.7 (max)Anthropic美	54	$3.85/M
5/85	✳Claude Sonnet 5 (max)Anthropic美	53	$2.31/M
5/85	◉GPT-5.5 (high)OpenAI美	53	$4.35/M
7/85	智GLM-5.2 (max)智谱 Z.ai中	51	$0.90/M · 开源最强
8/85	◉GPT-5.5 (medium)OpenAI美	50	$4.35/M
8/85	◆Gemini 3.5 FlashGoogle美	50	$1.31/M · 167 t/s
10/85	✳Claude Sonnet 4.6 (max)Anthropic美	47	$2.31/M
11/85	◆Gemini 3.1 Pro PreviewGoogle美	46	$1.74/M
11/85	通Qwen3.7 Max阿里 Alibaba中	46	$1.43/M · 199 t/s
13/85	MMiniMax-M3MiniMax中	44	$0.22/M · 开源第二
13/85	深DeepSeek V4 Pro (max)DeepSeek中	44	$0.18/M
15/85	KKimi K2.6月之暗面 Kimi中	43	$0.70/M
16/85	米MiMo-V2.5-Pro小米 Xiaomi中	42	$0.18/M
16/85	KKimi K2.7 Code月之暗面 Kimi中	42	$0.70/M
18/85	智GLM-5.1智谱 Z.ai中	40	$0.90/M
18/85	✕Grok Build 0.1xAI美	40	$0.54/M
20/85	通Qwen3.7 Plus阿里 Alibaba中	39	$0.25/M

最佳开源：GLM-5.2 (max) 51 · 最便宜：Qwen3.5 0.8B $0.01/M · 最快：Mercury 2 918 t/s。共 85 个模型上榜，此处取 Top 20。

LMArena (原 Chatbot Arena)

Arena Elo（数百万真实用户盲测偏好）2026-07-01 快照

UC Berkeley LMSYS 发起，基于真实用户盲测投票的 Elo 排名，最贴近真实使用偏好，业界公信力最高。全榜 298 个模型。

#	模型	Elo	票数
1/298	◆Gemini 3.5 Flash / 3 ProGoogle美	1490	27.8k 票
2/298	✕Grok 4.5xAI美	1477	28.0k 票
3/298	◆Gemini 3.1 ProGoogle美	1472	13.2k 票
4/298	✳Claude Opus 4.8 thinkingAnthropic美	1470	19.9k 票
5/298	✳Claude Opus 4.7Anthropic美	1467	21.2k 票
6/298	✕Grok 4.3xAI美	1465	32.0k 票
7/298	◆Gemini 3 FlashGoogle美	1462	9.6k 票
8/298	度ERNIE 5.0百度 Baidu中	1459	4.8k 票
9/298	◉GPT-5.5 highOpenAI美	1458	24.4k 票
10/298	◆Gemini 3.5 Flash-LiteGoogle美	1451	87.6k 票
11/298	✳Claude Sonnet 5Anthropic美	1451	38.4k 票
12/298	度ERNIE 5.0 Thinking百度 Baidu中	1450	9.7k 票
13/298	✳Claude Opus 4.6Anthropic美	1450	35.0k 票
19/298	智GLM-5.2智谱 Z.ai中	1441	9.6k 票 · 开源最高
23/298	通Qwen3.7 Max阿里 Alibaba中	1434	27.9k 票
26/298	KKimi K2.7月之暗面 Kimi中	1429	26.1k 票
31/298	深DeepSeek V4DeepSeek中	1423	11.8k 票
65/298	米MiMo-V2.5小米 Xiaomi中	1395	9.3k 票
68/298	混Hunyuan 3.0腾讯 Tencent中	1393	2.2k 票
81/298	MMiniMax-M3MiniMax中	1382	8.7k 票

序号为在全榜 298 个模型中的真实名次（故国产模型会出现 65、81 等跳号，反映其全球实际位置，非连续 Top 20）。模型名以图形渲染无法抓取，依「排名+机构+公开信息」还原、仅供参考，完整榜单以官网为准。