Google 工程副总裁、Gemini 联合负责人 Noam Shazeer 宣布,他将离开现有职位,加入 OpenAI。
今天,Noam Shazeer 在 X 上发文宣布,自己将离开 Google,加入 OpenAI。这很可能是今年人工智能领域最重要的一次人才变动,因为这位 50 岁的工程师正是 Google 下一代最强 AI 技术 Gemini 的三位负责人之一。
对 Gemini 来说,这无疑是一个残酷的消息。Shazeer 不仅是 Gemini 的联合负责人、Google 工程副总裁,还是 Transformer、T5 和 Switch Transformer 等重要论文的合著者,也是稀疏 MoE 模型的先驱之一。
据 OpenAI 首席研究官 Mark Chen 发帖内容来看,Noam Shazeer 将担任 OpenAI 架构研究负责人。
前 Ai2 高级研究科学家、后训练负责人 Nathan Lambert 也忍不住调侃:OpenAI 这下算是解决了他们所谓的“预训练规模问题”。
一个反复回到 Google、又反复感到挫败的人
从 Noam Shazeer 的 LinkedIn 履历来看,他与 Google 的关系贯穿了职业生涯的大部分时间。2000 年 12 月,他以软件工程师身份加入 Google。2012 年再次入职 Google,担任首席软件工程师。2024 年 8 月,他重返 Google,担任工程副总裁兼 Gemini 联合负责人。
而这中间有一段比较戏剧性的创业经历。
2021 年,Shazeer 离开 Google,创办了 Character.AI。导火索是,Google 拒绝发布他参与开发的一款聊天机器人。当时,他与 Google 同事 Daniel De Freitas 合作开发了一个最初名为 Meena 的聊天机器人,它能够围绕广泛话题展开自然对话。
据熟悉相关文件的人士透露,Shazeer 曾在一份广为流传的备忘录《Meena Eats the World》中预测,这款聊天机器人有可能取代 Google 搜索,并创造数万亿美元收入。
不止这一件事情,实际上他在 Google 的 AI 生涯里,长期伴随着一种反复出现的挫败感。
Shazeer 于 2000 年加入 Google 时,是公司最早的几百名员工之一。当时的 Google 要求每个人都必须有一位导师,Shazeer 后来在播客中回忆,自己刚加入时什么都不懂,什么都去问导师,而他的导师正是 Jeff Dean。他还开玩笑说,并不是 Google 每个人都什么都懂,只是 Jeff Dean 什么都懂,因为很多东西基本都是他写的。
Shazeer 早年其实就已经在想 AI。他在播客中说,自己当时加入 Google,一个朴素想法是先赚一些钱,以后就可以长期去做 AI 研究。后来他也承认,Google 确实一度成了一个非常适合做 AI 的地方。
2012 年,他再次加入 Google Brain。Shazeer 后来在播客中回忆,2012 年前后,他曾离开 Google 一段时间,有一次只是回公司和妻子吃午饭,碰巧坐到了 Jeff Dean 和早期 Google Brain 团队旁边。Shazeer 当时的第一反应是:“哇,这是一群很聪明的人。” Shazeer 再次被这群人吸引,Jeff Dean 则笑称自己把他“哄回来了”。
Shazeer 还自嘲说,自己似乎每隔 12 年就会“重新加入一次 Google”:2000 年一次,2012 年一次,2024 年又一次。
但这段经历里最有代表性的挫败,并不只是某个项目没能发布,而是一个天才研究员在大公司里不断撞上的机会成本和系统复杂度。
Shazeer 在播客里提到,Larry Page 以前常说,Google 第二大的成本是税,最大的成本是机会成本。也就是说,真正可惜的不是做错了什么,而是明明看到一个巨大机会,却没有及时抓住。放在 Shazeer 身上,这种机会成本显得格外刺眼:他很早就看到了语言模型、聊天机器人和下一代 AI 产品的潜力,但在 Google 内部,这些想法往往要经过安全、公平、业务、组织和产品化的多重权衡。
与此同时,大模型研发本身也不是一个“聪明人想到点子就能立刻改变世界”的过程。Shazeer 在播客中说,小规模研究最理想的状态,是早上醒来想到一个主意,当天写出来,跑一些实验,很快看到初步结果。但真正难的是把这些改进放到大系统里。一个小实验看起来有希望,放大后未必成立;几个看起来各自有效的改进叠在一起,也未必能协同工作。他甚至说,这种“叠不起来”的情况大约会发生一半。
这也是 Google 式 AI 研发最令人挫败的地方:它拥有世界上最强的研究人员、最庞大的代码库、最先进的 TPU 和数据中心,但越到大规模训练,问题越像一团纠缠在一起的线。Shazeer 说,最大规模实验是无法真正加速的,最后仍然是 N=1 的实验,只能把一群聪明人放在房间里盯着结果,判断到底为什么有效、为什么无效。模型稍微变差一点,可能是量化推得太狠,可能是数据问题,可能是代码里有 bug,也可能是某个底层系统噪音。更麻烦的是,神经网络对噪音很宽容,很多错误不会让系统直接崩掉,只会让模型悄悄变差。
Google 花 27 亿美元追回的人,又被挖走了
回头去看,Shazeer 绝对也是 AI 领域最强的人之一。他进入 Google 参与的第一个重要项目,是构建一套系统,用于改进 Google 搜索引擎的拼写纠错功能。加入 Google 不久后,他就向当时的 CEO Eric Schmidt 提出,希望获得数千颗计算芯片的使用权限。
Schmidt 在 2015 年斯坦福大学的一次演讲中回忆,Shazeer 当时对他说:“我要在这个周末之前解决通用知识问题。”那次早期尝试虽然以失败告终,但 Schmidt 相信,Shazeer 具备打造人类级智能 AI 的潜力。Schmidt 在演讲中说:“如果说世界上有谁最有可能做到这件事,我能想到的就是他。”
2017 年,Shazeer 与另外七位 Google 研究人员共同发表了论文《Attention Is All You Need》,详细描述了一种能在人类给出提示后可靠预测序列中下一个词的计算机系统。这项工作后来成为生成式 AI 技术的基础。
之后,Shazeer 与 Google 同事 Daniel De Freitas 合作,开发了一款最初名为 Meena 的聊天机器人。它可以围绕各种话题自信地与人对话。据熟悉相关文件的人士称,Shazeer 曾在一份广为流传的备忘录《Meena Eats the World》中预测,这款聊天机器人有可能取代 Google 搜索引擎,并创造数万亿美元收入。然而,Google 高管以安全性和公平性方面的担忧为由,拒绝将这款聊天机器人向公众发布。
2021 年,Shazeer 和 De Freitas 离开 Google,创办了 Character.AI。
但创业也不顺利,公司没有稳定的盈利模式。
一年后,OpenAI 发布 ChatGPT,证明大众对 AI 聊天机器人的需求远比许多大公司预想得更强。2023 年 3 月,Character.AI 完成 1.5 亿美元融资,估值达到 10 亿美元。
Shazeer 和团队最初希望,人们会愿意为与各种聊天机器人互动付费。这些机器人既可以提供实用建议,也可以模仿名人,比如 Elon Musk,或者模仿 Percy Jackson 这样的虚构人物。Shazeer 曾在播客中表示,这类产品会对很多孤独或抑郁的人非常有帮助。
但随着公司发展,Character.AI 也遇到了一些偏离创始团队设想的问题。员工越来越多地需要阻止用户进行浪漫角色扮演,这类使用方式并不符合 Shazeer 和 De Freitas 原本的愿景。同时,和许多试图与 OpenAI、微软等巨头竞争的 AI 创业公司一样,Character.AI 也面临高昂研发成本压力,在形成稳定收入来源之前,继续烧钱变得越来越困难。
2024 年的时候,Shazeer 曾考虑为 Character.AI 继续融资,也接触过潜在买家,其中包括 Facebook 母公司 Meta。不过,Character.AI 最终与 Google 母公司 Alphabet 达成交易,并在博客中表示,自公司创立以来,AI 行业的格局已经发生了变化。
Google 为此斥资约 27 亿美元,获得了 Character.AI 的技术授权,Shazeer 本人则以副总裁头衔回到 Google 工作,从管理一家拥有数百名员工的公司,转向专注于研究,并负责管理一个小团队,其中包括 De Freitas。据报道,他持有 Character.AI 30% 至 40% 的股份,这意味着他个人获得了 7.5 亿至 10 亿美元的收益。
这次回归,让 Google 士气大振。当时就有网友形容,Google 员工在 X 上的反应,几乎像是在见证“耶 稣复活”。这句夸张的调侃背后,恰恰说明了 Shazeer 在 Google AI 团队中的特殊地位:他不只是一个被高价请回来的明星研究员,更像是 Google 曾经错失、如今又拼命追回的关键人物。
但不到两年后,剧情又一次反转。Shazeer 这次离职,有人注意到,他的告别措辞显得异常简短:没有提到 Character.AI,没有提到自己留下的团队,只用了类似“继续前进”的说法。于是有网友猜测,这次离开也许并不只是一次普通跳槽,背后可能存在某种被动退出,或者至少是一场谈好的体面分手。
参考链接:
https://x.com/NoamShazeer/status/2067400851438932297
https://www.dwarkesh.com/p/jeff-dean-and-noam-shazeer
本文来自微信公众号 “InfoQ”(ID:infoqchina),作者:Tina,36氪经授权发布。