
谷歌token消耗量一年增长50倍,已是微软/ChatGPT的6倍

今天巴克莱一篇对比谷歌和微软在推理流量上token消耗的对比,非常有意思,甚至有些出乎投资者意料外的内容。“免费”带来需求暴增,而且推理成本比预期的低不少。
1.AI推理规模的绝对领先
Alphabet在1Q25共推理≈634万亿(634T)tokens,而Microsoft约100T;到2025年4月,月度推理量已升至480T,较一年前的9.7T激增50倍,显示Google在AI推理流量上具备6倍于Azure/ChatGPT的规模优势。
2.增长驱动力——免费AI产品而非付费订阅
推理量暴涨主要来自Search的AIOverviews等免费场景;GoogleSearch用户基数约为ChatGPT的5–6倍,免费AItoken增速(50×)远超付费大模型收入增速(3–4×),凸显Google先以用户与数据壁垒为先、后续再寻求变现。
3.成本冲击被高估:推理花费仅占搜索收入≈1%
按Gemini2.5费率估算,1Q25推理成本约7.5亿美元,仅占搜索收入的≈1%(占COGS+Opex1.6%);即便token按4倍速度继续攀升,也仍低于搜索核心基础设施成本(≈18%收入),缓解市场对利润率下滑的担忧。
4.资本开支结构:训练为主,推理仅用≈10%
GoogleAI计算CAPEX中约90%仍投向训练与新模型,推理对应的芯片CAPEX在1Q25仅6.2%(≈6亿美元)。若按480T月度run-rate估算,2Q25推理CAPEX也仅升至≈14%,显示资金仍主要押注长期模型演进。
5.硬件效率:≈27万颗TPUv6即可支撑现有推理
采用50/50Pro与Flash模型、15%ActiveParameters假设,Google仅用≈270kTPUv6(ASP≈4,500美元)即可覆盖1Q25推理负荷,体现自研加速器在功耗与成本端的优势。
6.未来催化:Astra、Mariner、Veo等代理式应用
尚未全面放量的通用AI助手(ProjectAstra)、浏览器代理(Mariner)和视频生成模型(Veo)预计将进一步推高token基数,Google已提前把Compute CAPEX提升到总CAPEX的>50%,为2026年后AI需求埋下增量弹性。