数据详实版

大模型发展历史数据报告

从 Transformer 到 DeepSeek-R1,8 年技术演进全景。附 Token(词元)官方定义、中国调用量爆发数据、OpenClaw 驱动因素分析。

编制时间:2026年4月1日
数据来源:国家数据局、OpenRouter、第一财经等
报告类型:技术演进与数据分析

0核心数据速览

中国大模型发展的关键数字

140万亿
中国日均 Token 调用量
2026年3月
1000x
两年增长倍数
2024-2026
9.85万亿
中国周调用量
连续四周超越美国
$557.6万
DeepSeek 训练成本
仅为 GPT-4 的 1/10
关键结论

大模型变化太快,传统经验正在失效。算力成本一年下降 80%,Token 调用量每 4 个月翻 4 倍。课题组的调研不求完美,需要敏态进行;AI 项目落地同样需要敏态完成。

1Token(词元)官方定义

2026年3月,国家数据局正式定名

📖 官方定义

2026年3月,在中国发展高层论坛年会上,国家数据局局长刘烈宏正式将 Token 定名为"词元"

刘烈宏指出:"词元不仅是智能时代的价值锚点,更是连接技术供给与商业需求的'结算单位',为商业模式的落地提供了可量化的可能。"

🔤
信息最小单元
AI 处理信息的最小单位
📏
计量单位
大模型调用量的评估标准
💰
计价单位
大模型厂商的计费单位
💎
数字原油
AI 时代的核心资源
数据来源:新华社、国家数据局新闻发布会(2026年3月24日)

2中国 Token 调用量爆发式增长

国家数据局官方数据,两年增长超千倍

1000亿
2024年初
日均 Token 调用量
100万亿
2025年底
日均 Token 调用量
140万亿
2026年3月
日均 Token 调用量
1000x
两年增长
超千倍
数据来源:国家数据局新闻发布会、中国发展高层论坛2026年年会(刘烈宏发言)

3OpenClaw 带动的爆发式增长

开源 Agent 框架成为 Token 消耗的核心驱动力

核心数据

OpenRouter 平台数据,截至 2026 年 3 月 9-15 日的周度数据,平台内20% 的 Token 消耗由 OpenClaw 贡献。第一财经指出:"OpenClaw 是本轮 Token 消耗增长的核心驱动因素。"

📊 OpenRouter 平台数据

  • • 2026年2月周均 Token 为 2025 年 Q4 的 2 倍以上
  • • OpenClaw 贡献平台 20% Token 消耗
  • • OpenClaw 登顶 GitHub 历史第一

🌍 全球影响

  • • KPMG:中国 93% 受访者已使用 AI
  • • 英伟达 CEO 黄仁勋:OpenClaw 将成最重要开源项目
  • • 腾讯云、阿里云举办 OpenClaw 安装活动
数据来源:第一财经、OpenRouter 平台、CNN、Forbes

4中国大模型调用量超越美国

连续四周超越美国,全球调用量前三被中国包揽

时间 中国调用量 美国调用量 环比增长 状态
2月9-15日 4.69万亿 3.294万亿 +11.83% 首超美国
3月16-22日 7.359万亿 2.954万亿 +56.9% 连续三周
3月23-29日 9.857万亿 3.007万亿 +33.94% 连续四周

调用量排名前五的中国模型(3月23-29日)

🥇
MiMo-V2-Pro
小米
1.49万亿
🥈
Step 3.5 Flash
阶跃星辰
1.34万亿
🥉
M2.5
MiniMax
1.25万亿
4️⃣
V3.2
DeepSeek
0.98万亿
5️⃣
GLM5 Turbo
智谱 AI
0.87万亿
数据来源:OpenRouter 平台、每日经济新闻、第一财经、证券时报(2026年3月30日报道)

5DeepSeek 带来的成本革命

训练成本仅为 GPT-4 的 1/10,引发全球震动

GPT-3 (2020)

~$1200万

参数量:1750 亿

GPT-4 (2023)

~$10亿

参数量:万亿级 MoE

DeepSeek-V3 (2024)

$557.6万

参数量:6710 亿(激活 370 亿)

🔧 技术突破

  • • 仅使用 2048 块 H800 GPU,耗时 2 个月
  • DeepSeek-MoE 架构:混合专家模型
  • 稀疏注意力机制:长文本效率提升
  • 开源决定:模型权重全面开源

💥 全球影响

DeepSeek-V3 发布后,英伟达股价单日暴跌 17%,市值蒸发约 6000 亿美元,创美股史上最大单日市值损失纪录。

数据来源:DeepSeek-V3 技术报告、凤凰网、新浪财经、Reuters

6四个发展阶段

从架构革命到成本革命,技术迭代的加速曲线

第一阶段 · 2017-2019

🏗️ 架构革命

2017 · Transformer
Google 发布,"AI 时代的蒸汽机"诞生
2018 · GPT vs BERT
"预训练+微调"范式确立
2019 · 规模的力量
GPT-2 展示零样本学习
第二阶段 · 2020-2022

📊 规模突破

2020 · GPT-3
1750 亿参数,验证 Scaling Law
2022.01 · InstructGPT
引入 RLHF,对齐人类意图
2022.11.30 · ChatGPT
AI 历史分水岭,2 个月用户破 1 亿
第三阶段 · 2022-2023

🎆 爆发元年

2023.03 · GPT-4
多模态、高级推理
2023 · 百模大战
文心、通义、豆包、混元,中国 AI 觉醒
2023.07 · Llama 2 开源
Meta 开源商用模型
第四阶段 · 2024-2026

🤖 智能体与成本革命

2024 · Agent 元年
从"对话"到"行动"
2025.01 · DeepSeek-R1
成本革命,训练成本仅 $557.6万
2026.02-03 · 中国超越美国
Token(词元)正式定名

7数据来源汇总

所有数据均来自公开可追溯来源

🏛️ 政府官方

  • • 国家数据局新闻发布会(2026年3月24日)
  • • 中国发展高层论坛2026年年会
  • • 新华社官方报道

📊 数据平台

  • • OpenRouter 平台(全球最大 AI 模型 API 聚合平台)
  • • DeepSeek-V3 技术报告
  • • 摩根大通研究报告

📰 财经媒体

  • • 第一财经、证券时报、每日经济新闻
  • • 21世纪经济报道、新浪财经
  • • Reuters、CNN、Forbes

🔍 调研机构

  • • KPMG 2025 年度调查报告
  • • IDC 中国公有云市场报告
  • • 信通院大模型调用量分析报告