Google花27亿美元追回的Gemini联合负责人Noam Shazeer,不到两年跳槽OpenAI!
Google花27亿美元追回的人,又被挖走了
Google工程副总裁、Gemini联合负责人Noam Shazeer宣布,他将离开现有职位,加入OpenAI。今天,Noam Shazeer在X上发文宣布,自己将离开Google,加入OpenAI。这很可能是今年人工智能领域最重要的一次人才变动,因为这位50岁的工程师正是Google下一代最强AI技术Gemini的三位负责人之一。对Gemini来说,这无疑是一个残酷的消息。Shazeer不仅是Gemini的联合负责人、Google工程副总裁,还是Transformer、T5和Switch Transformer等重要论文的合著者,也是稀疏MoE模型的先驱之一。据OpenAI首席研究官Mark Chen发帖内容来看,Noam Shazeer将担任OpenAI架构研究负责人。前Ai2高级研究科学家、后训练负责人Nathan Lambert也忍不住调侃:OpenAI这下算是解决了他们所谓的“预训练规模问题”。
一个反复回到Google、又反复感到挫败的人
从Noam Shazeer的LinkedIn履历来看,他与Google的关系贯穿了职业生涯的大部分时间。2000年12月,他以软件工程师身份加入Google。2012年再次入职Google,担任首席软件工程师。2024年8月,他重返Google,担任工程副总裁兼Gemini联合负责人。而这中间有一段比较戏剧性的创业经历。2021年,Shazeer离开Google,创办了Character.AI。导火索是,Google拒绝发布他参与开发的一款聊天机器人。当时,他与Google同事Daniel De Freitas合作开发了一个最初名为Meena的聊天机器人,它能够围绕广泛话题展开自然对话。据熟悉相关文件的人士透露,Shazeer曾在一份广为流传的备忘录《Meena Eats the World》中预测,这款聊天机器人有可能取代Google搜索,并创造数万亿美元收入。
不止这一件事情,实际上他在Google的AI生涯里,长期伴随着一种反复出现的挫败感。Shazeer于2000年加入Google时,是公司最早的几百名员工之一。当时的Google要求每个人都必须有一位导师,Shazeer后来在播客中回忆,自己刚加入时什么都不懂,什么都去问导师,而他的导师正是Jeff Dean。他还开玩笑说,并不是Google每个人都什么都懂,只是Jeff Dean什么都懂,因为很多东西基本都是他写的。Shazeer早年其实就已经在想AI。他在播客中说,自己当时加入Google,一个朴素想法是先赚一些钱,以后就可以长期去做AI研究。后来他也承认,Google确实一度成了一个非常适合做AI的地方。
2012年,他再次加入Google Brain。Shazeer后来在播客中回忆,2012年前后,他曾离开Google一段时间,有一次只是回公司和妻子吃午饭,碰巧坐到了Jeff Dean和早期Google Brain团队旁边。Shazeer当时的第一反应是:“哇,这是一群很聪明的人。”Shazeer再次被这群人吸引,Jeff Dean则笑称自己把他“哄回来了”。Shazeer还自嘲说,自己似乎每隔12年就会“重新加入一次Google”:2000年一次,2012年一次,2024年又一次。
但这段经历里最有代表性的挫败,并不只是某个项目没能发布,而是一个天才研究员在大公司里不断撞上的机会成本和系统复杂度。Shazeer在播客里提到,Larry Page以前常说,Google第二大的成本是税,最大的成本是机会成本。也就是说,真正可惜的不是做错了什么,而是明明看到一个巨大机会,却没有及时抓住。放在Shazeer身上,这种机会成本显得格外刺眼:他很早就看到了语言模型、聊天机器人和下一代AI产品的潜力,但在Google内部,这些想法往往要经过安全、公平、业务、组织和产品化的多重权衡。
与此同时,大模型研发本身也不是一个“聪明人想到点子就能立刻改变世界”的过程。Shazeer在播客中说,小规模研究最理想的状态,是早上醒来想到一个主意,当天写出来,跑一些实验,很快看到初步结果。但真正难的是把这些改进放到大系统里。一个小实验看起来有希望,放大后未必成立;几个看起来各自有效的改进叠在一起,也未必能协同工作。他甚至说,这种“叠不起来”的情况大约会发生一半。
这也是Google式AI研发最令人挫败的地方:它拥有世界上最强的研究人员、最庞大的代码库、最先进的TPU和数据中心,但越到大规模训练,问题越像一团纠缠在一起的线。Shazeer说,最大规模实验是无法真正加速的,最后仍然是N=1的实验,只能把一群聪明人放在房间里盯着结果,判断到底为什么有效、为什么无效。模型稍微变差一点,可能是量化推得太狠,可能是数据问题,可能是代码里有bug,也可能是某个底层系统噪音。更麻烦的是,神经网络对噪音很宽容,很多错误不会让系统直接崩掉,只会让模型悄悄变差。
Google花27亿美元追回的人,又被挖走了
回头去看,Shazeer绝对也是AI领域最强的人之一。他进入Google参与的第一个重要项目,是构建一套系统,用于改进Google搜索引擎的拼写纠错功能。加入Google不久后,他就向当时的CEO Eric Schmidt提出,希望获得数千颗计算芯片的使用权限。Schmidt在2015年斯坦福大学的一次演讲中回忆,Shazeer当时对他说:“我要在这个周末之前解决通用知识问题。”那次早期尝试虽然以失败告终,但Schmidt相信,Shazeer具备打造人类级智能AI的潜力。Schmidt在演讲中说:“如果说世界上有谁最有可能做到这件事,我能想到的就是他。”
2017年,Shazeer与另外七位Google研究人员共同发表了论文《Attention Is All You Need》,详细描述了一种能在人类给出提示后可靠预测序列中下一个词的计算机系统。这项工作后来成为生成式AI技术的基础。之后,Shazeer与Google同事Daniel De Freitas合作,开发了一款最初名为Meena的聊天机器人。它可以围绕各种话题自信地与人对话。据熟悉相关文件的人士称,Shazeer曾在一份广为流传的备忘录《Meena Eats the World》中预测,这款聊天机器人有可能取代Google搜索引擎,并创造数万亿美元收入。然而,Google高管以安全性和公平性方面的担忧为由,拒绝将这款聊天机器人向公众发布。
2021年,Shazeer和De Freitas离开Google,创办了Character.AI。但创业也不顺利,公司没有稳定的盈利模式。一年后,OpenAI发布ChatGPT,证明大众对AI聊天机器人的需求远比许多大公司预想得更强。2023年3月,Character.AI完成1.5亿美元融资,估值达到10亿美元。Shazeer和团队最初希望,人们会愿意为与各种聊天机器人互动付费。这些机器人既可以提供实用建议,也可以模仿名人,比如Elon Musk,或者模仿Percy Jackson这样的虚构人物。Shazeer曾在播客中表示,这类产品会对很多孤独或抑郁的人非常有帮助。
但随着公司发展,Character.AI也遇到了一些偏离创始团队设想的问题。员工越来越多地需要阻止用户进行浪漫角色扮演,这类使用方式并不符合Shazeer和De Freitas原本的愿景。同时,和许多试图与OpenAI、微软等巨头竞争的AI创业公司一样,Character.AI也面临高昂研发成本压力,在形成稳定收入来源之前,继续烧钱变得越来越困难。
2024年的时候,Shazeer曾考虑为Character.AI继续融资,也接触过潜在买家,其中包括Facebook母公司Meta。不过,Character.AI最终与Google母公司Alphabet达成交易,并在博客中表示,自公司创立以来,AI行业的格局已经发生了变化。Google为此斥资约27亿美元,获得了Character.AI的技术授权,Shazeer本人则以副总裁头衔回到Google工作,从管理一家拥有数百名员工的公司,转向专注于研究,并负责管理一个小团队,其中包括De Freitas。据报道,他持有Character.AI 30%至40%的股份,这意味着他个人获得了7.5亿至10亿美元的收益。
这次回归,让Google士气大振。当时就有网友形容,Google员工在X上的反应,几乎像是在见证“耶稣复活”。这句夸张的调侃背后,恰恰说明了Shazeer在Google AI团队中的特殊地位:他不只是一个被高价请回来的明星研究员,更像是Google曾经错失、如今又拼命追回的关键人物。
但不到两年后,剧情又一次反转。Shazeer这次离职,有人注意到,他的告别措辞显得异常简短:没有提到Character.AI,没有提到自己留下的团队,只用了类似“继续前进”的说法。于是有网友猜测,这次离开也许并不只是一次普通跳槽,背后可能存在某种被动退出,或者至少是一场谈好的体面分手。
