分享好友 健康资讯首页 健康资讯分类 切换频道

又走一个,OpenAI研究VP离职,转投Anthropic做RL研究员

2026-03-05 12:104036kr

心态崩了!OpenAI又走了一个重量级人物。

刚刚,前研究副总裁Max Schwarzer在X上发文,宣布正式离开OpenAI,转投Anthropic。

他在OpenAI主导整个post-training团队,亲手参与训练了o1、o3,以及GPT-5、5.1、5.2、5.3-Codex全系列模型。

但他不是被挖走的,是自己主动选择走的,理由是「渴望回归一线IC研究工作」。

这个选择,比离职本身更耐人寻味。

他亲历了o1的诞生

在AI圈,Max Schwarzer算不上家喻户晓,但他的履历相当拿得出手。

2024年3月,他在蒙特利尔人工智能研究院Mila完成博士答辩,导师是强化学习领域的两位重量级人物:Aaron Courville和Marc Bellemare。

博士期间,他的研究聚焦在「规模化与样本高效强化学习」的交叉地带。

通俗来说,就是怎么让RL训练既强又省。

他在2023年ICML发表的论文拿下了当年的顶会奖项,证明了不依赖LLM或世界模型,纯靠扩展无模型RL就能达到人类水平的样本效率。

论文传送门:https://arxiv.org/abs/2305.19452

但真正让他进入OpenAI核心圈的,是他对推理的判断。

2024年9月12日,o1-preview发布当天,他发帖说这是「推理时代的开端」。

他是OpenAI o1的核心贡献者之一,参与了「草莓团队」(Strawberry team)的RL算法开发,o1-preview的早期去风险化实验更是出自他手。

之后,他主导了o1和o3的post-training,2025年3月晋升为研究副总裁,领导整个post-training团队,负责打磨GPT-5系列。

从应届博士生入职,他用不到两年半时间就坐上了研究VP的位置。

顶级VP:我只想回去做研究

离职声明里都是对OpenAI的称赞:「OpenAI有我见过的最有才华的一批研究员」「我学到的东西超出了我作为应届毕业生时的想象」。

关于离职的真正的理由,他说:

领导了一年的post-training工作之后,我渴望重新出发,回到IC研究岗位。我一直在认真考虑回归技术研究这件事,而且我真心相信,我的同事和团队在没有我的情况下完全能够继续成功。

这句话值得细品。

IC研究,相对于管理角色来说,就是亲手写代码、跑实验;管理层负责管人、协调资源、做路线规划。

对研究员来说,升得越高,离真正的研究越远。

Schwarzer显然不适应这种状态。

他在OpenAI的最后一年,更多时间花在带团队、做决策上。

站在研究VP的位置上,他可以影响几十人的研究方向,但自己动手的空间少了很多。

这种选择在AI行业并不罕见,但肯做出这个选择的人需要勇气。

毕竟,「研究VP」的头衔在任何简历上都足够好看,放弃它回去当普通研究员,不是每个人都愿意的。

事实上,Schwarzer不是第一个从post-training主管位置出走的人。

他的前任Liam Fedus,同样担任过OpenAI研究副总裁兼post-training负责人,于2025年3月离职,随后联合创办了AI初创公司Periodic Labs,目标是打造「AI科学家」。

从OpenAI离职的人前赴后继,令人深思。

OpenAI的人才流失:不只是走了几个人

Schwarzer是近两年OpenAI人才出走潮中的最新一个,但绝对不是最后一个。

2025年以来,离开OpenAI的研究员和高管名单越来越长:前CTO Mira Murati、首席研究官Bob McGrew、研究副总裁Barret Zoph,在2024年集中离职。

2025年夏天,Jason Wei、Zhiqing Sun、Hyung Won Chung等多位研究科学家相继跳槽Meta。

后者在LinkedIn上公开表示,很高兴能「从一张白纸开始,与真正有才华密度的团队共事」,言下之意耐人寻味。

到现在,Altman是OpenAI原始11人创始团队中仅剩的两位成员之一。

两周前,CNN报道称,一批AI研究员正在「边走边拉警报」。

OpenAI的一位研究员在离职时表示,这项技术「有以我们无法理解、更无法阻止的方式操纵用户的潜力」。

OpenAI还在同一周因为反对推出成人模式而解雇了一名安全主管,并被曝解散了专注于确保AI对全人类有益的使命对齐团队。

Schwarzer的离职声明里没有任何批评,反而充满了对OpenAI的善意。

这种体面的分手,反而格外少见。

此时此刻的Anthropic

他选了Anthropic,岗位是RL研究,这个他最擅长的领域,不做管理,就做研究。

Anthropic近两年持续吸引了来自OpenAI的顶尖人才。

2024年,对齐研究负责人Jan Leike、OpenAI联合创始人John Schulman先后加入,前者明确表示是因为对OpenAI「没有认真对待安全」的不满。

2026年初,OpenAI的高级安全研究员Andrea Vallone也跳槽到Anthropic,在Jan Leike手下工作。

而Schwarzer加入的时间节点,格外微妙。

就在前几天,Anthropic正经历它五年历史中最大的一场风波:与五角大楼的正面交锋。

Anthropic拒绝向国防部开放Claude用于大规模监控或全自主武器的权限,特朗普随即在Truth Social上命令所有联邦机构立即停用Anthropic的技术。

而与此同时,OpenAI迅速填补了这一真空,达成向五角大楼开放其模型的协议。

讽刺的是,在Anthropic最艰难的时刻,Claude在苹果App Store的下载量反而超过了ChatGPT,Anthropic的估值目前高达3800亿美元

Schwarzer在声明结尾写道:「我期待支持在这个重要时刻的朋友们。」

他说的重要时刻,大概不只是指Anthropic自身的研究进展。

Schwarzer选择在这个节点加入,某种程度上是一次站队。

正面临最大危机的Anthropic,正在用一件事证明自己的吸引力:在商业压力和安全底线之间,它选择了后者,哪怕代价是失去整个联邦政府的合同。

对于那些不缺钱、只缺使命感的顶级研究员而言,这种姿态,比任何offer都有说服力。

参考资料:

https://x.com/max_a_schwarzer/status/2028939154944585989?s=20

本文来自微信公众号“新智元”,作者:新智元,编辑:倾倾,36氪经授权发布。

举报
收藏 0
打赏 0
评论 0
抛弃“不作恶”,谷歌和五角大楼签订协议、承接美军机密AI业务,超700名员工联名反对
谷歌,这个曾以“不作恶”为行为准则的科技巨头,如今正深陷一场前所未有的内部风暴。28日,美国消费者新闻与商业频道(CNBC)援引科技媒体“The Information”报道,谷歌已与美国国防部签署协议,承接机密人工智能业务。一位知情人士透露,美国国防部正将谷歌的最新模型用于机密项目。这个项目遭到了谷歌员工的强烈反对。CNBC报道称,本周,700余名谷歌员工联名致信公司首席执行官桑达尔・皮查伊,要

0评论2026-04-299

一季度净利环比暴增27倍,剑桥科技股价一年涨三倍,险资与社保基金加仓,股东高管减持
4月27日盘后,光模块概念大牛股剑桥科技(603083.SH、06166.HK)发布2026年一季报,公司一季度营收同比增长43.98%至12.87亿元;归母净利润同比增长276.44%至1.18亿元。从环比来看,剑桥科技今年第一季度营收环比下滑约12%;净利润环比增长2722.62%,而2025年第四季度归母净利润环比下跌近97%。作为光模块大牛股,剑桥科技H股曾在11个交易日完成了翻倍,4月2

0评论2026-04-298

32美元一辆车,Tesla为什么不认?(下)
本案真正值得关注的,不只是Tesla能不能把Avanci平台价格拉进英国法院。更重要的是,如果法院最终认为这类平台许可条款不能进入FRAND审查,那么未来SEP权利人通过专利池、平台、集体许可安排对外收费时,实施者还能不能有效挑战其许可条件?这才是本案超出Tesla、InterDigital和Avanci三方争议的地方。从表面看,Avanci提供的是一种提高交易效率的许可方案。大量SEP权利人把专

0评论2026-04-299

“保本”又“看病”?监管部门约谈健康险公司,中介平台下架热销“医疗金”产品
早在前两年,市场上就出现了带有一般医疗保险金账户的产品。随着利率下行以及市场需求增长,这类产品的资产增值属性被放大,经过长期现金价值积累,配合可以累积的医疗保险金,使得产品有着不输理财型产品的收益率,这也是引起监管部门关注的原因之一。2026年4月初,当保险经纪人小李带着客户在同仁堂线下门店参加体验活动时,他可能不会想到,体验活动中的重磅产品“岁月长安·特定疾病保险(互联网版)”即将面临下架。4月

0评论2026-04-295