昨天凌晨,小米MiMo大模型的一则公告,在开发者圈子里激起了不小的水花。
公告的主题很简单:降价,而且是大幅降价。
MiMo-V2.5系列API永久调整价格,最高降幅达到惊人的99%,而且不再区分上下文窗口长度。此前计费体系引入的Credits积分制仍然保留,套餐可用量提升大约5-8倍。
如果这件事从一个更高的视角来看,那就不仅仅是一次促销活动:这是在DeepSeek V4刷新行业价格底价仅仅四天后,国产大模型阵营发生的第一次“光速”跟进。
而在这场名为普惠的阳谋背后,藏着国产模型生存现状的冷酷真相,以及关于token价值的深刻误区。
01
DeepSeek出题,小米交卷
很多AI行业关注者第一时间感叹小米的动作之快。梁文锋的DeepSeek刚刚“用小石子”击落API价格,小米后脚就完全对标了V4 Pro和V4 Flash两款模型的价格。
这传递出了一个极其明确的信号:此前我坚持认为国产AI行业必将发生的第二次价格战早已降临,而且已经悄悄进入了“红海肉搏”阶段。
客观来说,所有人都必须承认一个事实:现阶段的国产模型,与GPT-5.5和Opus 4.7比起来,依然存在难以在短时间内逾越的代差。个人认为,这个代差在未来还会继续扩大。
在“最顶尖的智能”领域,国产模型还在全力追赶;但在“非复杂任务”的规模化应用场景下,国产模型之间的智能水平其实拉不开绝对差距。
当智能水平无法产生代差时,性价比(ROI)就成为了唯一的护城河。
梁文锋带领的DeepSeek用激进的定价策略和连续几次降价公告已经证明,在性能仍处国内第一梯队的基础之上,低价就是获取流量并让用户产生“替代依赖”的最有效手段。
而小米的迅速跟进,验证了另一个逻辑:在这场竞赛中,谁不跟进,谁就得坐等用户流失。国内模型性能领先的两家企业都进行了如此大幅度的降价,足以证明部分厂商的订阅服务和API价格虚高。这已经不是“想不想降价”的问题,而是“不降价就出局”的生存问题。
02
110亿Credits背后的数学游戏
价格虽然发生了惊天动地的变化,但是小米推出订阅服务时采用的Credits计费单位却不动如山。
从营销角度来看,这确实是一次简单而聪明的操作:99元买13亿token,听起来很划算;而99元买110亿Credits,听起来简直就是在发福利。
这种高额数字带来的冲击力,能极大地对冲用户对“降价是否缩水”的焦虑。不过,人们仍然应该冷静下来算一笔账,看看背后的商业玄机。
API价格上,小米之所以能喊出最高降幅99%的口号,更多是因为其原始定价在DeepSeek的冲击之下显得过于传统和保守。为了实现对标,以及不让用户被瞬间夺走,API必须进行这种毁灭式的降价。
订阅服务上,小米在国内首创Token Plan,这种透明性和可解释性更强的计费方式逐渐开始成为全球主流,官方宣称容量提升幅度约为5-8倍。
以订阅量最大、最常用且最便宜的Lite档位订阅为例,token可用量从60M提升至500M,折算下来单位成本降幅约88%,略低于API降价幅度。更高档位的订阅服务,成本下降幅度则更小一些。
这种差异不难理解,因为订阅服务本身就是一种“批发价”,此前已经比直接使用API划算得多。无论是国内还是国外,用户在有订阅服务的情况下都会优先选择订阅。
因此,小米的这一系列措施的目的已然明晰:通过把API价格打到与DeepSeek一致来吸引流量,再通过订阅服务锁定高频用户。即便订阅服务的折扣力度没有API那般夸张,但由于DeepSeek不提供订阅服务,作为第二个“吃螃蟹的人”,小米的Token Plan已经是目前市面上最划算的“算力包”。
这种差异化的设计,实际上也是在引导行为:它鼓励用户去做高频、重复的智能体调用,因为只有在这类场景下,小米的成本最低、用户的体感也最便宜。
03
同样的价格,不一样的含金量
当价格被抹平到同一水平线时,决定胜负的唯一指标就变成了token的生产力价值。
根据Artificial Analysis的测评以及实测效果反馈,小米的MiMo V2.5 Pro和DeepSeek V4 Pro呈现出了不同的价值取向。
DeepSeek更像是一个偏科型选手,编程和逻辑推理能力略显领先,而且占据用户心智更为成功,目前是不少个体开发者或小型开发企业的首选。然而,DeepSeek在多模态领域的缺失,严重影响了应用场景扩张,目前的专家模式识图也只是聊胜于无。
小米打造的则是一个全能型选手,模型发布时就明确标注了“全模态”。在同样的API定价下,小米的token能够处理图像、音频和视频等复杂交互形式,相比只能处理文本的DeepSeek,在智能体应用上会更有优势。
这也是此前我反复强调过的观点:多模态能力在智能体时代绝不能忽视,反而应该得到更多重视。
既然如此,小米降价的底气何在?公告中提到的技术细节,隐隐约约透露出了小米如何压低单位token的物理成本。
SGLang HiCache和SWA(滑动窗口注意力)这两个词值得重点关注。简单来说,小米认为在大模型的推理过程中,成本最昂贵的环节就是GPU显存中的KV Cache。
SWA技术让模型不再需要为了记住几万字前的废话而消耗掉海量的内存,这就能解释为什么小米这次取消了上下文窗口长度的阶梯计费。而多级存储优化,将数据在显存、内存和SSD之间的搬运量降到了原先的七分之一。
技术的领先,最终转化成了定价的自由度。
当小米能把缓存命中的开销降低到上一代模型的十分之一甚至百分之一时,降价99%就不再是做慈善和单纯的营销,而是在释放技术红利,顺便清理掉那些技术架构陈旧、成本降不下来的竞争对手。
04
警惕token货币化,智能才是真价值
最后,无论是DeepSeek还是小米的降价,AI行业的所有人都应该关注一个深层次的行业乱象。
现在的AI市场,token这个词似乎被异化成了一种“本位货币”。在过去的两个月内,有些企业开始考核员工“每个月消耗了多少token”,开发者们也开始炫耀自己的token用量。
但这本身就是一个误区:token不是货币,不同模型的token价值也完全不同。
像是GPT-5.5和Opus 4.7这样的顶级模型,它们的token价值高,是因为用少量的token就能完成复杂的任务,具备极高的生产力密度。
而低智能水平模型的token,哪怕按亿供给,如果无法解决问题,生产力价值依然趋近于零。
而前段时间,国内外有不少厂商趁着编程代理软件的火爆,纷纷上调订阅服务和API的价格,本质上都是在利用token概念的模糊性混水摸鱼,让不熟悉AI的用户误以为所有模型的token都是同一种原材料。
如今,DeepSeek掀了桌子,小米焊死了门。两家企业动作的本质,是让token回归了它的真实价值:作为一种廉价的“赛博工业耗材”,它必须足够便宜,才能支撑起大规模的AI应用。
大模型的第二次价格战已经悄然开始,而这次价格一旦被打下来,绝不会像上一次价格战结束后那么容易就涨价回去。对于那些依旧抱着高昂定价不放、却拿不出顶尖智能水平的厂商来说,寒冬可能比预想的要更近。
最后,小米在公告中的结语值得分享给每个人:技术的价值,最终要体现在被使用的广度上。
当token不再昂贵,国产大模型才能真正从实验室中的样本转变成每个人都能按需取用的水和电。
而关于这场智能价值的洗牌,才刚刚拉开序幕。
本文来自微信公众号“硅基星芒”,作者:思齐,36氪经授权发布。