分享好友 健康资讯首页 健康资讯分类 切换频道

高通新发AI推理芯片,瞄准每年3000亿美元市场

2025-10-29 20:0116036kr

北京时间10月27日晚间,高通发布了AI200及AI250两款AI数据中心芯片,以及基于两款芯片的加速卡和机架级解决方案;两款芯片计划分别于2026和2027年投入商用。

这也是继高通在2019年发布Cloud AI 100、2023年发布Cloud AI 100 Ultra后,又一次推出数据中心AI推理新品。

消息发布当天,高通股价急剧拉升,盘中一度飙升22%达205美元,这也是高通自2024年6月下旬以来的最高股价,最终闭盘收于每股188美元,涨幅为11.09%。包括摩根大通、美银证券、TD Cowen等多家投行更新了对高通的评级并维持买入,最高买入价格看至200美元。

同一天,高通还宣布将与沙特阿拉伯AI企业“HUMAIN”合作,推进AI200和 AI250落地应用。

随着AI应用需求暴增,市场对AI推理芯片需求水涨船高。今年英伟达、谷歌、华为均已公布AI推理芯片新品。面向AI推理的蓝海市场,各家比拼的将不仅是技术能力,更是跑马圈地的速度。

对高通而言,此次对AI推理的发力不仅是涉足热门方向,也是推进其数据中心业务布局的最新一步。近年,高通曾多次公开展露其对数据中心市场的兴趣,除了AI推理芯片,高通同样在数据中心CPU等方向展开了产品布局。

在官宣AI200及AI250发布的新闻稿最后,高通也写道:高通致力于制定一个按年推进节奏的数据中心路线图,专注于提供行业领先的AI推理性能、能源效率及TCO(总拥有成本)。

跻身2025数据中心推理芯片竞速赛道

“AI推理”指已经过训练的模型经过部署后,对新输入的数据进行逻辑推导与预测。与之对应的则是“AI训练”,指模型通过分析庞大的数据集、学习其中的模式与关系。

在实际应用中AI训练与推理芯片之间并没有严格、明确的划分,但相较训练场景要求芯片具备绝对强大的并行计算能力,推理场景更强调芯片的能效、时延、成本等综合性能。本次发布的高通新品同样着力于针对总拥有成本 (TCO) 和性能进行平衡设计。

据官方信息,AI200及AI250基于高通NPU技术,其中基于AI200的机架级AI推理解决方案支持每张卡768GB的LPDDR(低功耗双倍数据速率内存),以提高内存容量和降低成本;而AI250 解决方案将首次使用基于近内存计算的创新内存架构,有效内存带宽大幅提升且功耗更低。

此外两种机架解决方案均采用直接液冷散热方案,采用PCIe进行纵向扩展,采用以太网进行横向扩展,采用机密计算以确保安全的AI工作负载,单机架功耗为160kW。

高通新品于此时亮相是想踩中AI推理市场爆发的宝贵时间窗口。

今年以来,AI推理市场动态频出。比如9月份,AI推理创企Groq官宣已达成7.5亿美元的新融资,并称接下来计划建成“全球最大推理数据中心”。

同样在9月份,OpenAI已与老牌云计算巨头甲骨文达成合作的消息在市场中广为流传,据称OpenAI已敲定将在5年内从甲骨文采购逾3000亿美元的推理算力——这也是有史以来经披露的最大云计算合同。消息一出,甲骨文股价一度急剧拉升,单日最大涨幅超36%。

而据巴克莱银行旗下研究机构预测,到2026年,AI推理计算需求将占通用人工智能总计算需求的70%以上,推理计算的需求甚至可以超过训练计算需求、达到后者的4.5倍;而现有芯片资源可能难以满足这一需求,需增加当前预测4倍的芯片资本支出,总额或将接近3000亿美元。

面向巨大的需求缺口,包括高通在内的许多厂商正在摩拳擦掌。

今年4月,谷歌于Google Cloud Next 25大会上发布了TPU芯片“Ironwood”,号称其为首个专门为大规模AI推理而设计的TPU加速器。

9月,英伟达发布了针对AI视频生成和软件开发等大规模上下文处理任务的“RubinCPX” GPU。后者基于Rubin架构打造,能够在计算密集型的上下文推理阶段实现突破性性能表现,计划于2026年底上市。

同样于9月举办的华为全联接大会上,昇腾多系列新品亮相,其中“950PR”将于2026年第一季度对外推出、着力提升推理Prefill(AI推理过程中的关键阶段)性能。

换句话说,从2026年开始,高通将与英伟达、谷歌、华为等企业在AI推理的赛场上同台竞技。以巴克莱所预测的3000亿美元资本支出推算,即便占据到1%的市场份额,对高通而言也是不容小觑的营收增长。

“重返”数据中心市场,发掘业绩新引擎

高通并未说明AI200和AI250所采用的制程及基本架构方案,但考虑到AI100并非GPU而是ASIC,新款产品有可能也采用了ASIC的基础架构。ASIC (专用集成电路)是一种为特定任务设计的全定制芯片,相较GPU,在能效方面表现更优。

尽管已经在6年内推出多款AI推理芯片,高通AI推理业务贡献的营收几乎可以忽略不计。

7月底公布、截至6月30日的2025第三财季业绩报告显示,高通QCT半导体业务该季营收为89.93亿美元,主要来自手机芯片、汽车芯片、物联网业务;QTL技术授权板块营收为13.18亿美元。

过往多年,高通曾多番尝试开发数据中心产品,但成效甚微。2018年,高通服务器芯片负责人Anand Chandrasekher官宣离职,并传出整个服务器部门裁员50%的消息,被市场解读为高通已放弃这一业务方向。

直到2024年,Amon于Computex 2024展会接受采访时确认高通将重返数据中心市场,并从2025年开始推进产品动作。

2025年5月,高通表示计划采用英伟达技术,来定制生产数据中心CPU,用以搭配和连接英伟达GPU使用、助力英伟达GPU实现更加快速的通信。

6月,高通宣布其间接全资子公司Aqua Acquisition Sub LLC将以24亿美元收购半导体IP企业Alphawave,后者的优势在于拥有高端接口IP,能够增强高通在数据中心市场的竞争力。此桩收购预计在2026年第一季度完成。

此外,高通近日宣布与沙特阿拉伯的 HUMAIN 合作,HUMAIN 正在开发阿拉伯语多模态大语言模型(ALLaM),并计划将其与高通的边缘设备生态深度集成,形成从芯片到应用的完整技术闭环。

而在与沙特阿拉伯公司HUMAIN的合作中,高通将为该项目提供“全球人工智能推理服务”,使之成为世界上首个完全优化的边缘到云混合人工智能(项目),使沙特阿拉伯成为全球人工智能中心。

左-HUMAIN CEO Tareq Amin;右-高通CEO Cristiano Amon

尽管布局节奏紧凑,数据中心板块为高通贡献营收仍需时间。

7月底,2025第三财季业绩说明会,高通总裁兼CEO Cristiano Amon曾在电话会中讲到,公司正积极拓展AI芯片布局,已经与一家超大规模云端服务供应商展开深入洽谈,最快将于2028会计年度开始贡献数据中心相关营收。

除了AI,高通也在极力推进产品在智慧驾驶、物联网等多元化场景的落地。

考虑到苹果与高通的基带购买协议将于2026年末到期,而苹果是高通营收占比约20%的单一大客户,“能否在苹果‘撤出’后培育新的营收支柱?”将是市场亟待高通解答的命题。

本文来自微信公众号“电厂”,作者:董温淑,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
业绩“双降”!360亿“血王”,遭遇至暗时刻
A股“血王”正经历至暗时刻。有“血王”之称的上海莱士近日发布2025年年报,这份财报为这家血液制品龙头企业的“黄金时代”画上了沉重的句号。财报显示,上海莱士2025年实现营业收入73.48亿元,同比下降10.13%;归母净利润15.77亿元,同比大幅下滑28.1%;扣除非经常性损益净利润15.60亿元,同比下降24.25%。这是上海莱士自2019年以来首次出现营收与净利润“双降”,业绩降幅远超市场

0评论2026-04-262

A股“疯狂扫货”,120亿芯片大佬欲跨界“抄底”?
120亿身家的芯片大佬蒋学明,近期在A股资本市场上动作频频。在短短数日时间,与蒋学明存在千丝万缕关系的企业接连出手,相继在休闲零食和刀剪赛道落子。4月8日,休闲零食上市公司来伊份发布公告称,其控股股东拟将10%的股权以3.84亿元的价格转让给东合恒一,而后者的最终受益人为蒋学明。仅仅9天后的4月17日,张小泉通过公告披露,由蒋学明名下公司担任执行事务合伙人的瀚朋启琛,被确定为张小泉集团的重整中选投

0评论2026-04-263

日更7.5万首,播放不足3%:AI音乐沦为“虚假繁荣”?
Suno V5、Lyria 3 Pro、Mureka V9……从30秒片段到3分钟完整曲目,从简单旋律到精细化编曲,AI音乐大模型正在以肉眼可见的速度重构音乐行业的生产逻辑。但热闹之下,市场已是硝烟弥漫。一边,是版权方的严防死守。2026年4月,Suno与环球、索尼的版权谈判彻底崩盘,双方陷入“完全无路可走”的僵局;美国唱片业协会(RIAA)多次发声谴责AI音乐平台侵权,索赔金额高达每首15万美元

0评论2026-04-257