GPT-5.5翻倍，Gemini涨3倍：这波涨价游戏还能玩多久？_健康_健康资讯

前沿大模型的涨价游戏，还能玩多久？

今年1月至今，GPU租赁价格上涨超过两倍。

根据Counterpoint 2月发布的《内存价格追踪报告》，2026年第一季度至今，内存价格环比上涨80%-90%，创下前所未有的大幅飙升。

这种价格上涨，自然传递到了下游。

Epoch AI刚刚发布的《梯度更新》报告，做了一件简单粗暴的事：把全球所有Blackwell芯片能处理的Token数量算出来，再和实际需求一比。

结论只有一个字——不够。

Token洪流吞没一切

先看供给侧。

Epoch AI的模型以Kimi K2.6为基准——万亿参数、320亿活跃参数的MoE架构。

在8000:1000的输入输出比下，全球Blackwell集群的理论极限是每秒约200亿输出Token。

听起来很多？换算一下：够地球上每个人每月用700万Token。

但这是理想情况。一旦上下文窗口拉长到128k，吞吐量直接暴跌50倍，降到每秒约5亿Token。

再看需求侧。

Google刚刚披露，自家每秒处理约12亿Token（输入+输出）。

按8k:1k请求比例换算，每秒输出Token约1.3亿。Exponential View估算，Google大约占全球Token需求的25%。

这意味着当前全球Token需求，用Blackwell全产能、全给昂贵的万亿参数模型去跑，勉强能撑住。

但需求在以什么速度增长？

每年10倍。

自2024年以来，Google处理的Token量年增10倍，其他供应商的增速也差不多。

而供给侧呢？全球AI算力年增3.4倍，芯片内存带宽年增4.1倍。

供给3.4倍 vs 需求10倍。差距每年都在撕裂。

Meta员工一天烧100万Token

算力紧缺不是抽象数字。

看看企业内部在发生什么。

The Information报道，Meta的8.5万名员工每月消耗60万亿Token。

换算下来，每位员工每天烧掉约100万输出Token。

Apple更猛。

部分工程团队被允许每天在Token上花费300美元——按Kimi K2.6的价格算，够一个人一天生成2500万输出Token。

这还只是两家公司。

全球约有1400万软件工程师每天在用AI。

如果他们的使用强度达到Meta或Apple员工的水平，全球Token吞吐需求将飙升至每秒2亿到40亿Token。

40亿。

而Blackwell长上下文的极限是5亿。差了整整一个数量级。

Claude Code让开发者慢了19%

更尴尬的事情也在发生。

METR的最新研究显示，Claude Code在实测中让资深开发者的完成速度慢了19%。

VS Code相关插件的安装增速自年初以来明显趋平。

编码工具的增长放缓，背后可能是两个原因叠加：一是算力资源本身在吃紧，二是很多企业已经烧完了全年的AI预算。

与此形成鲜明对比的是，前沿模型还在涨价。

ChatGPT Pro订阅价格上调，Claude的API价格水涨船高，Gemini的涨幅最凶——部分场景下价格暴涨3倍。GPT-5.5的定价更是直接翻倍。

用得更多，花得更贵，效果却未必更好。

企业的算盘很快就打清楚了。

逃向DeepSeek

一条逃跑路线已经成型。

DeepSeek V3的训练成本仅为前沿模型的1/10到1/20，API价格低至同类的1/16。

性能呢？直逼GPT-5。

Hacker News上一个帖子火了：一套11个月ROI模型，手把手教企业算清楚——从GPT-5.5切到DeepSeek，每年能省多少钱。

评论区的共识很简单：前沿模型的定价权正在崩塌。

当一个开源模型能用1/16的价格跑出90%的效果，涨价就不再是信心的体现，而是客户流失的加速器。

Tokenmaxxing——企业疯狂堆Token用量来榨取AI价值——本来是前沿模型的增长叙事。

但现在，The Information的报道显示，这种策略正在反噬AI公司自身的利润边际。

用户越多，亏得越多。涨价止血，用户就跑。

经典的死亡螺旋。

算力悬崖前的决赛格局

把视角拉远一点。

前沿实验室——OpenAI、Anthropic、Google DeepMind——仅占全球AI算力的20%-30%。

剩下的70%-80%在企业自用、云服务商、推理服务商手里。

这意味着，即便是最顶尖的实验室，也无法靠自建算力解决供需缺口。它们和所有人一样，在抢同一批芯片。

算力每年增3.4倍，需求每年增10倍。这个剪刀差不会自动消失。

更小的模型确实在替代部分需求——蒸馏层的崛起证明了这一点。但能力提升又在不断制造新需求。

AI行业正站在一个悬崖边上。

不是技术的悬崖，模型还在变强。是经济的悬崖，算不过来账了。

当GPU租金翻倍、API价格暴涨、开源替代品性能逼近、编码工具的ROI被质疑，一个核心问题浮出水面：

前沿模型的护城河，到底是智能，还是算力？

如果答案是算力，那么谁控制芯片，谁就控制AI的未来。如果答案是智能，那么DeepSeek用1/16的价格逼近同等效果，已经在动摇这个答案。

参考资料：

https://counterpointresearch.com/en/insights/Memory-Prices-Surge-Up-to-90-From-Q4-2025

https://www.signalbloom.ai/posts/outsourcing-plus-localai-will-soon-become-more-economical-vs-frontier-labs/https://news.ycombinator.com/item?id=48278610

本文来自微信公众号“新智元”，作者：ASI启示录；编辑：大卫，36氪经授权发布。

史上最安静618，大促为什么不热闹了？

今年的618静悄悄。没有复杂的跨店满减，没有漫长的预售膨胀，也没有“满300减50再叠券”的数学题。走过 20多年61 8，在今年迎来了一次集体“减负”。但这场集体“减负”与其说是平台主动进化，不如说是被逼出来的。当百亿补贴变成常规频道、直播间天天全网最低价，大促赖以为生的稀缺感早已名存实亡。复杂的规则不再是刺激消费的工具，反而成了劝退用户的摩擦力。更耐人寻味的是，平台自己也不再执着于制造

0评论2026-05-280

三大运营商找到了新故事，但Token没那么好卖
0评论2026-05-28

氪星晚报｜微博：第一季度总营收4.213亿美元，同比增长6%；科大讯飞发布讯飞AI眼镜；日本太空企业AstroX计划从气球上发射火箭

大公司：格林生物创业板IPO过会36氪获悉，深交所上市审核委员会召开2026年第27次上市审核委员会审议会议，审议结果显示，格林生物科技股份有限公司首发符合发行条件、上市条件和信息披露要求。晨光股份：拟以5亿元至10亿元回购股份用于股权激励或员工持股计划36氪获悉，晨光股份公告，公司拟以自有资金通过集中竞价方式回购股份，回购资金总额不低于5亿元（含），不超过10亿元（含），回购价格不超过35元/股

0评论2026-05-280

段永平抄底了

神奇一幕出现了。港交所信息显示，段永平通过他控制的H&H International Investment, LLC，一举将泡泡玛特的持股比例推到了5.69%，持仓市值超110亿港元，成为公司第二大股东。老段变了。记得去年底，段永平还曾直言“看不懂泡泡玛特，不投资”，但今年的态度却超级大转弯——他卖掉了持有十几年的神华资产，全部置换为泡泡玛特股票，甚至连头像都换成了满桌子的泡泡玛特。没想到，这一买

0评论2026-05-280

还没买房的年轻人，先花9.9拼个豪华别墅
0评论2026-05-28

用惯了安卓机，我花2500捡漏了廉价新iPhone，结果真香了
0评论2026-05-28

宇树还没上市，最大对手又端出一个10亿美元独角兽
0评论2026-05-28

《给阿嬷的情书》逆袭背后：大麦娱乐财报里的长期主义样本
0评论2026-05-28

Claude Code首发「自愈」功能，一锤砸碎开发者6大噩梦
0评论2026-05-28

曾经的鄙视链底端，为何成为出海新福地？

漫步在今天首尔的街头，你可能会有一种陌生的熟悉感。江南站10号出口或龙山爱宝客商场，无数韩国年轻人顶着烈日排队 2-3 个小时，只为手里能拿上一杯霸王茶姬（CHAGEE）的“伯牙绝弦”；在中央大学等高校周边以及明洞商圈，蜜雪冰城的雪王城堡前挤满了为了高性价比高呼“真香”的韩国大学生；而杨国福麻辣烫更是彻底融入了韩国人的日常饮食，锅包肉和麻辣烫甚至成为了首尔白领的灵魂外卖。对于大部分韩国人来说，来自

0评论2026-05-280