中国AI“杀疯了”：Token调用量首超美国- 新闻综合

中国AI“杀疯了”：Token调用量首超美国

fyradio.com.cn 24 2026-02-28 13:37:10

　　炒股就看金麒麟分析师研报，权威，专业，及时，全面，助您挖掘潜力主题机会！

　　这两天，“中国AI模型的Token调用量首次超越美国”的新闻冲上了热搜。据全球最大API聚合平台OpenRouter的数据：2月9日-15日当周：中国模型调用量4.12万亿Token，美国2.94万亿，完成首次逆转。2月16日-22日当周：中国模型进一步增至5.16万亿Token（三周内增长127%），而美国模型回落至2.7万亿Token。

　　更令人振奋的是，在全球调用量排名前五的模型中，中国占据四席：MiniMax的M2.5、月之暗面的Kimi K2.5、智谱的GLM-5以及DeepSeek的V3.2。这四款模型合计贡献了Top5总调用量的85.7%。

中国AI“杀疯了”：Token调用量首超美国

　　为什么这个数据值得重视？

　　因为OpenRouter是目前全球最大的AI模型API聚合平台，拥有超过500万开发者用户，其API调用量数据被视为洞察全球AI应用落地趋势最真实的“晴雨表”。

　　最关键的是，该平台的用户主要由海外开发者构成——美国用户占比高达47.17%，而中国开发者仅占6.01%。这意味着，中国大模型的反超不是“自嗨”数据，而是全球开发者“用脚投票”的真实选择。

　　那中国大模型，为何实现了反超？

　　第一，是极致性价比。以输入100万Token为例，MiniMax和智谱的收费仅0.3美元，而海外主流对标产品（如Claude Opus）则高达5美元，是中国模型的约16.7倍。对于初创公司和开发者来说，这不仅是省钱，是生存。

　　第二，技术架构的“降本增效”。中国模型普遍采用MoE架构，也是能大幅度降低成本的原因。传统模型像全班同学一起做题，浪费算力；MoE架构像分小组作业，只让最擅长的“专家”参与计算。这种“按需激活”模式，让推理时的显存占用降低60%，吞吐量提升19倍。

　　第三，Token消耗的底层逻辑从“对话型”变成了“流程型”。过去AI是“问答工具”，一轮对话消耗几百到几千Token；现在AI是“数字员工”，单次任务可能消耗数十万Token。

　　需要说明的是，调用量的领先并不等同于技术的全面领跑。今天中国AI的发展，仍面临着基础理论的原创性不足等一系列挑战。这场超越不是终点，而是起点。

　　文案|张洪雷

　　编辑|华思雨

　　制图|管若潼

Mhmarkets迈汇:金价高位蓄势

24 2026-02-28

中国AI“杀疯了”：Token调用量首超美国

马斯克与奥尔特曼即将当庭对垒，本案还能否组建公正陪审团？

“教会AI，你走人” 美三大科技巨头一个月裁员4.6万人，员工们都经历了什么？

Mhmarkets迈汇:金价高位蓄势

最近发表

热评文章

开盘：美股周四开盘涨跌不一市场关注科技股财报

全球最大主权财富基金2025年盈利2470亿美元

知情人士：字节、阿里将于2月中旬推出新人工智能模型

*ST立方：公司股票短期内价格涨幅较大，明显偏离市场

亚马逊裁员1.6万个岗位印度有500至800个岗位

外资保险资管接连落地，更有“直接设立”大门打开，保险