分享好友 健康资讯首页 健康资讯分类 切换频道

DeepSeek-V4明确支持华为昇腾950芯片

2026-04-24 17:201036kr

受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调

时隔145 天,DeepSeek终于发布了新模型。

4月24日,DeepSeek宣布上线DeepSeek-V4的预览版本——其中包括两款模型,高性能版的DeepSeek-V4-Pro、轻量版的DeepSeek-V4-Flash。

按照DeepSeek官方披露的信息,DeepSeek-V4拥有百万字超长上下文,在Agent(智能体)能力、世界知识和推理性能上均在国内和开源领域保持领先。

DeepSeek还披露,目前DeepSeek-V4已成为公司内部员工使用的Agentic Coding(智能体编程)模型,评测反馈使用体验优于Claude Sonnet 4.5,交付质量接近Claude Opus 4.6非思考模式,但仍与Claude Opus 4.6的思考模式存在一定差距。

和全球最强模型的差距只有两个月

目前Anthropic旗下最先进的基础模型是4月16日发布的Claude Opus 4.7,它的综合性能几乎位居全球第一。Claude Opus 4.6于2月25日发布。

也就是说,DeepSeek-V4和全球性能最先进的模型性能差距几乎只有两个月左右。

DeepSeek发布模型的频率在主流模型厂商中几乎是最低的,时隔近五个月,它才发布了这款新模型。

据《财经》不完全统计,2025年12月1日-2026年4月24日,美国市场(OpenAI、Anthropic、谷歌Gemini)和中国(包括阿里千问、字节跳动豆包、腾讯混元、小米MiMo、DeepSeek、月之暗面、智谱、MiniMax)的11家主流模型公司,在144天内至少发布或迭代了53款模型,几乎每2.7天就会有一款模型发布或迭代。

DeepSeek-V4的技术报告披露,它使用了32万亿以上的Tokens(词元)进行训练。它的训练过程经历了三个阶段——预训练(Pre-training)、后训练(Post-training)、推理能力强化(Reasoning scaling)。

其中DeepSeek-V4-Pro的参数规模是1.6万亿,激活参数是490亿。DeepSeek-V4-Flash的参数规模是2840亿,激活参数是130亿。由于架构创新且不是全量激活,DeepSeek-V4每次激活时的推理计算成本只相当于百亿级参数规模的模型。

DeepSeek还公布了DeepSeek-V4两个版本模型的价格。其中高性能版的DeepSeek-V4-Pro输入价格1元/百万Tokens,输出价格24元/百万Tokens。轻量版的DeepSeek-V4-Flash输入价格0.2元/百万Tokens,输出价格2元/百万Tokens。

明确支持华为昇腾950,Token价格将大幅下降

市场关注的另一个问题是,DeepSeek-V4是否会提前适配华为昇腾950等国产AI(人工智能)芯片,甚至是否会基于国产AI芯片完成训练。

目前可以确认的是,DeepSeek-V4一定会支持华为昇腾950,并使用昇腾950进行推理。但它不一定是基于华为昇腾950训练的。

因为,DeepSeek在披露价格的同时,还在价格栏的小字中明确提到——受限于高端算力,目前DeepSeek-V4-Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格会大幅下调。

(图片来源:DeepSeek微信公众号)

也就是说,DeepSeek-V4系列的模型明确支持华为昇腾950这款国AI产芯片,且预计将在国产AI芯片上大幅降低单位Token价格。

昇腾950华为规划于2026年推出,面向大模型训练和推理的新一代AI芯片,它是昇腾910系列的升级版。一位华为计算产品合作伙伴今年3月曾向《财经》评价,在当前国产AI推理卡中,华为昇腾950极具竞争力。因为该卡采用全新架构,是目前国内唯一已商用、并明确支持FP4低精度推理的AI加速卡。

支持FP4意味着能把模型“压缩得更狠”,同样一张卡,能跑得动更大、更复杂的AI模型,而且速度更快、成本更低。《财经》了解到,华为昇腾950的单卡算力是英伟达H20的2.87倍,且搭载了华为自研国产HBM(高带宽内存)芯片。

一位算法工程师对《财经》表示,DeepSeek-V4适配国产AI芯片在预期之内。因为模型推理对国产AI芯片来说并不是难点。几乎所有中国模型公司发布新模型后,都会Day0适配包括华为昇腾、阿里平头哥、百度昆仑芯、寒武纪等国产AI芯片。

本文来自微信公众号“半熟财经”(ID:Banshu-Caijing),作者:吴俊宇 周源,编辑:谢丽容,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
财报“美颜”下的天能动力:铅酸见顶,百亿锂电不赢
23月底,港股铅蓄电池龙头天能动力(00819.HK)发布2025年年度财报,一组充满矛盾感的数据,直接引发了市场的分歧。全年来看,公司实现营业收入537.99亿元,同比下滑29.83%,规模较上年缩水超228亿元;归母净利润却逆势增长25.77%至14.37亿元,创下近三年最高盈利增速。反常的财务数据,并未换来资金的认可。财报发布次日,天能动力高开低走,后续数个交易日持续震荡下行。市场很清楚,这

0评论2026-04-241

AI,救不了失宠的影视行业
影视行业正身处多事之秋。一方面,昔日中国影视第一股华谊兄弟遭破产申请,行业老牌玩家深陷泥潭。另一方面,光线传媒同样承压。缺少头部IP《哪吒2》的支撑,公司2026年第一季度营收仅1.91亿元,同比下降93.59%;归母净利润2327.56万元,同比下降98.85%。与此同时,长视频龙头爱奇艺高调推出AI艺人库,本想抢占技术风口,却一夜之间引爆舆论争议,陷入信任危机。在不久前的2026爱奇艺世界大会

0评论2026-04-241

产值19倍于传统影院,西影“无界XR影院”在宁波爆棚!
4月20日,西影旗下“无界XR影院”披露其在宁波电影嘉年华期间的收益表现:单座椅最高日产值1200元。日均产值706元,对比传统影院最能打的春节档(2026年春节档单座日均产值约36.26元)——19倍之悬殊。这组数据一出来,不止景区等各类场景端,投资机构,恐怕也要按捺不住了。何出此言呢?除了虚拟现实技术带来深度沉浸感,重新勾起观众好奇心,坐观式XR影院的商业逻辑与传统影院亦大不相同。这种“一椅一

0评论2026-04-241

5万亿,KKR组织一趟中国走访
KKR来了。投资界从KKR获悉,近日KKR全球宏观与资产配置团队组团来到中国,行程包括北京和香港。他们走访了汽车、机器人及消费服务等多个行业的企业。“我们亲眼目睹了人工智能和自动化在多个行业的快速普及。”一趟下来,KKR合伙人Henry H. McVey感慨良多,他看到了更多值得长期关注的信号:中国供应链韧性优于其他经济体,中国人工智能战略正快速规模化推进,同时人民币汇率走强,也反映出全球对人民币

0评论2026-04-241

马斯克要造100万台机器人,它们身上的电机、减速器、丝杠,有多少是中国造
2026年1月,特斯拉完成了Optimus第三代机器人的供应链审厂。3月,马斯克在特斯拉全员大会上给出明确的量产指引——2026年目标生产5万到15万台Optimus,2030年的目标是5000万台。一个听起来更激进的数字,也被马斯克挂在嘴边——未来一年要造一亿台。一亿台什么概念?全球智能手机年出货量是12亿台左右。而在这个庞大数字的最底层——一台Optimus身上有多少零部件来自中国?先拆一台O

0评论2026-04-242

明明正确的战略,为什么注定失败?
我做企业研究时,经常遇到反直觉现象。比如最近,我做了几家公司的研究。研究过程里,有几个现象让我感到困惑,因为它们和主流战略逻辑完全相反:1、追觅在清洁品类还没坐稳行业第一的情况下,同时启动汽车、手机、大家电项目,分散资源——按照传统战略逻辑,这是致命错误。但追觅赢了。2、小鹏智驾团队明确知道给AI模型加几条规则可以立刻解决眼前的产品问题,却坚决拒绝——按照传统战略逻辑,产品先活下去是第一位的。但他

0评论2026-04-242