大模型发展历史报告（2017-2026）- 数据详实版

0核心数据速览

中国大模型发展的关键数字

140万亿

中国日均 Token 调用量
2026年3月

1000x

两年增长倍数
2024-2026

9.85万亿

中国周调用量
连续四周超越美国

$557.6万

DeepSeek 训练成本
仅为 GPT-4 的 1/10

关键结论

大模型变化太快，传统经验正在失效。算力成本一年下降 80%，Token 调用量每 4 个月翻 4 倍。课题组的调研不求完美，需要敏态进行；AI 项目落地同样需要敏态完成。

1Token（词元）官方定义

2026年3月，国家数据局正式定名

📖 官方定义

2026年3月，在中国发展高层论坛年会上，国家数据局局长刘烈宏正式将 Token 定名为"词元"。

刘烈宏指出："词元不仅是智能时代的价值锚点，更是连接技术供给与商业需求的'结算单位'，为商业模式的落地提供了可量化的可能。"

🔤

信息最小单元
AI 处理信息的最小单位

📏

计量单位
大模型调用量的评估标准

💰

计价单位
大模型厂商的计费单位

💎

数字原油
AI 时代的核心资源

数据来源：新华社、国家数据局新闻发布会（2026年3月24日）

2中国 Token 调用量爆发式增长

国家数据局官方数据，两年增长超千倍

1000亿

2024年初
日均 Token 调用量

100万亿

2025年底
日均 Token 调用量

140万亿

2026年3月
日均 Token 调用量

1000x

两年增长
超千倍

数据来源：国家数据局新闻发布会、中国发展高层论坛2026年年会（刘烈宏发言）

3OpenClaw 带动的爆发式增长

开源 Agent 框架成为 Token 消耗的核心驱动力

核心数据

据OpenRouter 平台数据，截至 2026 年 3 月 9-15 日的周度数据，平台内20% 的 Token 消耗由 OpenClaw 贡献。第一财经指出："OpenClaw 是本轮 Token 消耗增长的核心驱动因素。"

📊 OpenRouter 平台数据

• 2026年2月周均 Token 为 2025 年 Q4 的 2 倍以上
• OpenClaw 贡献平台 20% Token 消耗
• OpenClaw 登顶 GitHub 历史第一

🌍 全球影响

• KPMG：中国 93% 受访者已使用 AI
• 英伟达 CEO 黄仁勋：OpenClaw 将成最重要开源项目
• 腾讯云、阿里云举办 OpenClaw 安装活动

数据来源：第一财经、OpenRouter 平台、CNN、Forbes

4中国大模型调用量超越美国

连续四周超越美国，全球调用量前三被中国包揽

时间	中国调用量	美国调用量	环比增长	状态
2月9-15日	4.69万亿	3.294万亿	+11.83%	首超美国
3月16-22日	7.359万亿	2.954万亿	+56.9%	连续三周
3月23-29日	9.857万亿	3.007万亿	+33.94%	连续四周

调用量排名前五的中国模型（3月23-29日）

🥇

MiMo-V2-Pro

小米

1.49万亿

🥈

Step 3.5 Flash

阶跃星辰

1.34万亿

🥉

M2.5

MiniMax

1.25万亿

4️⃣

V3.2

DeepSeek

0.98万亿

5️⃣

GLM5 Turbo

智谱 AI

0.87万亿

数据来源：OpenRouter 平台、每日经济新闻、第一财经、证券时报（2026年3月30日报道）

5DeepSeek 带来的成本革命

训练成本仅为 GPT-4 的 1/10，引发全球震动

GPT-3 (2020)

~$1200万

参数量：1750 亿

GPT-4 (2023)

~$10亿

参数量：万亿级 MoE

DeepSeek-V3 (2024)

$557.6万

参数量：6710 亿（激活 370 亿）

🔧 技术突破

• 仅使用 2048 块 H800 GPU，耗时 2 个月
• DeepSeek-MoE 架构：混合专家模型
• 稀疏注意力机制：长文本效率提升
• 开源决定：模型权重全面开源

💥 全球影响

DeepSeek-V3 发布后，英伟达股价单日暴跌 17%，市值蒸发约 6000 亿美元，创美股史上最大单日市值损失纪录。

数据来源：DeepSeek-V3 技术报告、凤凰网、新浪财经、Reuters

6四个发展阶段

从架构革命到成本革命，技术迭代的加速曲线

第一阶段 · 2017-2019

🏗️ 架构革命

2017 · Transformer

Google 发布，"AI 时代的蒸汽机"诞生

2018 · GPT vs BERT

"预训练+微调"范式确立

2019 · 规模的力量

GPT-2 展示零样本学习

第二阶段 · 2020-2022

📊 规模突破

2020 · GPT-3

1750 亿参数，验证 Scaling Law

2022.01 · InstructGPT

引入 RLHF，对齐人类意图

2022.11.30 · ChatGPT

AI 历史分水岭，2 个月用户破 1 亿

第三阶段 · 2022-2023

🎆 爆发元年

2023.03 · GPT-4

多模态、高级推理

2023 · 百模大战

文心、通义、豆包、混元，中国 AI 觉醒

2023.07 · Llama 2 开源

Meta 开源商用模型

第四阶段 · 2024-2026

🤖 智能体与成本革命

2024 · Agent 元年

从"对话"到"行动"

2025.01 · DeepSeek-R1

成本革命，训练成本仅 $557.6万

2026.02-03 · 中国超越美国

Token（词元）正式定名

7数据来源汇总

所有数据均来自公开可追溯来源

🏛️ 政府官方

• 国家数据局新闻发布会（2026年3月24日）
• 中国发展高层论坛2026年年会
• 新华社官方报道

📊 数据平台

• OpenRouter 平台（全球最大 AI 模型 API 聚合平台）
• DeepSeek-V3 技术报告
• 摩根大通研究报告

📰 财经媒体

• 第一财经、证券时报、每日经济新闻
• 21世纪经济报道、新浪财经
• Reuters、CNN、Forbes

🔍 调研机构

• KPMG 2025 年度调查报告
• IDC 中国公有云市场报告
• 信通院大模型调用量分析报告