分享好友 健康资讯首页 健康资讯分类 切换频道

梁文峰和姚顺雨,四月交卷

2026-03-15 16:026036kr

撰文|画画

2026年4月,中国AI圈将迎来一次罕见的同台竞技。

DeepSeek V4,梁文锋打磨已久的多模态大模型,计划正式上线。

几乎同一时间,腾讯混元新模型也将发布,负责人是姚顺雨,2025年底刚刚回国,顶着腾讯总办首席AI科学家的Title走马上任。

两家公司,一南一北,一个初创,一个巨头。

一个是用量化私募思路颠覆了AI行业的理工男,一个是被腾讯用最高规格从海外请回来的学术派。

他们几乎不可能在同一张牌桌上出现,但4月,他们都要交卷。

这不是巧合,这是一个节点。

1、腾讯的那个决定

要理解4月意味着什么,必须回到2025年初腾讯做的那个决定。

彼时国内大模型市场,百度有文心,阿里有通义,字节有豆包,各家都在跑马圈地。腾讯混元排不进第一梯队,产品端的元宝几乎没有存在感。

就在这个时候,腾讯选择在元宝里接入DeepSeek。

这个决定在当时被很多人解读为务实之举,与其死撑自研,不如先用最好的模型把用户留住。

但它同时也是一个承认:在大模型能力这件事上,我们现在不如一家创业公司。

元宝的数据验证了这个决定的正确性。

接入DeepSeek之后,用户和活跃度明显回升。这是腾讯用流量换了时间,用元宝已有的产品生态和微信QQ的导流能力,换来了姚顺雨团队自研模型的窗口期。

但时间窗口终究有限。一旦混元最新的版本上线,腾讯面临的第一个真实问题是:留在元宝里的用户,到底认的是哪个名字?

这不是能靠市场调研回答的问题,它只能靠4月之后的留存数据来回答。

2、DeepSeek的另一道难题

DeepSeek这边,面对的是一种完全不同性质的压力。

V3发布之后,DeepSeek的数字是这样的:上线至2025年2月9日,累计下载超过1.1亿次,周活跃用户最高接近9700万。

这个量级,已经接近Twitter在鼎盛期的日活水平,对于一个发布不到半年的AI应用,当时几乎没有先例。

更大的影响发生在行业层面。V3发布后,英伟达单日市值蒸发约6000亿美元,美国科技圈开始重新讨论算力军备竞赛的逻辑是否成立。

DeepSeek用一个开源模型,在成本和效率上同时挑战了大模型必须靠暴力堆算力的行业共识。

但这组数字和这段叙事,也同时变成了V4必须背负的重量。

市场对V4的预期,不是比V3更好,而是能不能再次重新定义。这是一个很难完成的任务,因为V3已经把天花板拉得很高。

梁文锋选择的应对方式,是让V4的迭代方向足够具体,而不是继续打效率革命的旗号。

从论文节奏看,这个准备早就开始了。

2025年12月,署名包含梁文锋团队的《mHC: Manifold-Constrained Hyper-Connections》发表,方向是底层架构的连接方式优化;

2026年1月,梁文锋署名的《Conditional Memory via Scalable Lookup》提出条件记忆机制,在推理过程中,模型可以根据条件动态检索和激活相关记忆,而不是把所有历史上下文都塞进一个固定窗口里。

这两篇论文,距离V4发布只有几个月。它们不是学术展示,更像是产品路线图的技术背书。

V4还有一条线被单独提出,深度适配国产芯片,并有望成为首个完全运行在国产算力生态上的顶级大模型。

在此之前,所有顶级大模型的训练和推理都高度依赖英伟达的GPU。华为昇腾、寒武纪等国产芯片在性能和软件生态上与英伟达仍有差距,适配工作远比听起来复杂。

如果V4真的跑通了,意味着中国大模型产业链上最关键的一环,算力依赖第一次出现了可被验证的替代路径。

3、两条路,同一个终点

有意思的是,DeepSeek和腾讯在技术路线上正在往同一个方向收拢:长上下文、长期记忆、Agent可用性。

这不是巧合,这是整个行业正在形成的共识。下一代AI竞争的核心,不再是谁的参数更多,而是谁能真正记住用户、理解上下文、在复杂任务中持续工作。

但两家公司走向这个终点的路径截然不同。

DeepSeek的做法是从底层架构动刀,条件记忆机制是要在模型本身的记忆方式上做根本性改变。

腾讯的做法是先定义评测标准,CL-bench提出了一套衡量上下文学习能力的新基准。

如果这套标准被学术圈和行业接受,腾讯就获得了一个叙事上的主动权:你的模型好不好,要按我定的标准。

两种路径,代表了两种不同的竞争策略。做出更好的产品,和定义什么叫更好的产品,是两件事。

历史上,后者有时候比前者活得更久。但前提是,你定的标准得被别人接受。如果DeepSeek V4的能力直接碾压了CL-bench设定的评测维度,那套标准就只是腾讯的自我评分。

4、四月之后

4月会到来,两张考卷会被打开,市场会给出它的判断。

但真正值得追问的问题,比谁的模型更好要复杂得多。

第一个问题:腾讯能不能接住用户的切换?

从接入DeepSeek到推出自研混元,这条路如果走通,腾讯的体量、数据、场景接入,微信、QQ、腾讯视频、游戏、企业微信,一旦有了够用的底座,这些场景的价值才能被真正释放出来。

但如果切换之后用户留存下滑,腾讯可能需要重新评估自己在这场竞争里的位置。

第二个问题:DeepSeek能不能守住国产第一的位置?

V3之后,DeepSeek已经不只是一个产品,它是一个标准、一种叙事。

V4需要证明,这不是偶然,而是一种可持续的能力。

尤其是在国产芯片这条线上,如果跑通了,DeepSeek将拥有一个其他顶级大模型都没有的叙事,而这个叙事的价值,可能比模型本身还要大。

第三个问题,也是最大的问题:谁在争定义权?

大模型的下半场,不只是谁的能力更强,更是谁来定义下一代AI应该是什么样的。

梁文锋的答案是:开源、高效、记忆力强、跑在自己的芯片上。

姚顺雨和腾讯的答案是:深度融合场景、长上下文、Agent友好。这两个答案并不互斥,但代表了两种不同的路径,一个是从模型出发往应用走,一个是从应用出发往模型走。

4月,只是一个节点。真正的答案,可能需要整个2026年来慢慢揭晓。

但有一件事是确定的,2025年初,元宝接入DeepSeek的那一刻,是中国AI格局的一次重组,大公司第一次公开承认,创业公司在核心技术上跑到了前面。

2026年4月,如果混元和V4同时亮相,将是另一次重组的开始,不再是谁领先的问题,而是各自走哪条路的问题。

中国AI的故事,正在从赛跑变成分道。

而分道,往往比赛跑,更有意思。

【版面之外】的话:

两家公司,两种路径,一个时间点。

真正有意思的,不是分数。是在这两张答卷里,会看到两种完全不同的安全感。

DeepSeek的安全感,来自把东西做出来,开源、高效、跑在自己的芯片上,这套打法能持续。

腾讯的安全感,来自把东西放进去,放进微信里,放进QQ里,放进游戏里。

4 月的交卷,对于腾讯来说,不是为了向外界证明什么,本质上是为了把元宝的大脑,从 DeepSeek 那里赎回来。

本文来自微信公众号“版面之外”,作者:画画,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
抛弃“不作恶”,谷歌和五角大楼签订协议、承接美军机密AI业务,超700名员工联名反对
谷歌,这个曾以“不作恶”为行为准则的科技巨头,如今正深陷一场前所未有的内部风暴。28日,美国消费者新闻与商业频道(CNBC)援引科技媒体“The Information”报道,谷歌已与美国国防部签署协议,承接机密人工智能业务。一位知情人士透露,美国国防部正将谷歌的最新模型用于机密项目。这个项目遭到了谷歌员工的强烈反对。CNBC报道称,本周,700余名谷歌员工联名致信公司首席执行官桑达尔・皮查伊,要

0评论2026-04-2912

一季度净利环比暴增27倍,剑桥科技股价一年涨三倍,险资与社保基金加仓,股东高管减持
4月27日盘后,光模块概念大牛股剑桥科技(603083.SH、06166.HK)发布2026年一季报,公司一季度营收同比增长43.98%至12.87亿元;归母净利润同比增长276.44%至1.18亿元。从环比来看,剑桥科技今年第一季度营收环比下滑约12%;净利润环比增长2722.62%,而2025年第四季度归母净利润环比下跌近97%。作为光模块大牛股,剑桥科技H股曾在11个交易日完成了翻倍,4月2

0评论2026-04-2912

32美元一辆车,Tesla为什么不认?(下)
本案真正值得关注的,不只是Tesla能不能把Avanci平台价格拉进英国法院。更重要的是,如果法院最终认为这类平台许可条款不能进入FRAND审查,那么未来SEP权利人通过专利池、平台、集体许可安排对外收费时,实施者还能不能有效挑战其许可条件?这才是本案超出Tesla、InterDigital和Avanci三方争议的地方。从表面看,Avanci提供的是一种提高交易效率的许可方案。大量SEP权利人把专

0评论2026-04-2914

“保本”又“看病”?监管部门约谈健康险公司,中介平台下架热销“医疗金”产品
早在前两年,市场上就出现了带有一般医疗保险金账户的产品。随着利率下行以及市场需求增长,这类产品的资产增值属性被放大,经过长期现金价值积累,配合可以累积的医疗保险金,使得产品有着不输理财型产品的收益率,这也是引起监管部门关注的原因之一。2026年4月初,当保险经纪人小李带着客户在同仁堂线下门店参加体验活动时,他可能不会想到,体验活动中的重磅产品“岁月长安·特定疾病保险(互联网版)”即将面临下架。4月

0评论2026-04-298