起底OpenAI核心班底,600多人和他们塑造的AI格局

“理想国” 的分裂,新 openai 如何取代旧 openai。

文丨贺乾明 黄帧昕数据分析、制图丨黄帧昕编辑丨黄俊杰

迄今诞生的所有互联网产品,只有两个能在上线两年做到每周 2.5 亿人用,一个是抖音,一个是 chatgpt。区别在于,chatgpt 起步没有让人上瘾的舞蹈,也基本不买量推广。

到今年 11 月,chatgpt 产品问世满两年,给 openai 带来 37 亿美元收入,远远甩开 google、facebook 同一时期的水平,高过拼多多上市时的情况,1570 亿美元的公司估值也破了历史纪录。

数字不那么性感的一面是,openai 一年 37 亿美元收入,靠的是近 90 亿美元支出——花 2.4 元,拿回 1 元,是 wework、商汤级别的经营效率。

openai 希望用激进增长解决盈利问题。据 the information,openai 预计到 2026 年,用 400 亿美元的支出换来 260 亿美元的营收——相当于百度营收的近 1.4 倍;到 2029 年,用 1000 亿美元的支出实现盈利。

从白宫的罗斯福厅到台积电的会议室,山姆·阿尔特曼(sam altman)都在描绘需要无限投入才可能实现的宏伟目标。他计划用 1000 亿美元建一个数据中心,装 200 万 ai 芯片,耗电 5 吉瓦——相当于 400 多万美国家庭一年的用电量;要是他来管台积电,得投资 70000 亿美元,建 36 个晶圆厂生产 ai 芯片。这些数字如此疯狂,以至于台积电一位高管嘲笑他的方案是 “播客网红哥”(podcasting bro)水平:纸上谈兵、不切实际。

在 openai 内部,激进增长已面临压力:前员工创办的 anthropic 在亚马逊的强力支持下正在瓜分市场份额;越来越多开发者发现,不用最领先的大模型也能解决文本总结等问题;而模型能力的提升也可能遇到瓶颈 ......

不能因此就断言阿尔特曼是空想家,至少 chatgpt 的头两年正是靠着他一贯非凡的野心闯出来的:在几个万亿美元超级巨头控制基础设施的消费互联网市场,一个半营利的研究型组织能在巨头的城墙上凿出裂缝。至于是什么让 openai 在当时资本匮乏的状况下如此横空出世,其联合创始人、总裁格雷格·布洛克曼(greg brockman)曾解释说:“(人才)是 openai 的秘密武器。”

然而随着公司从非营利转向营利,openai 解决了资本问题却也触发了人的问题——组织动荡和人才流失过去两年几乎没停下过。失去秘密武器的 openai 让自己处于一个动荡多变的细分市场,变化的关键因素正是——人。

chatgpt 发布两周年,我们从人入手研究全球第一大 ai 创业公司的变化。这些人的流向不仅塑造了 openai,也牵引着全球的 ai 行业。

我们曾希望将 chatgpt 列为共同作者,但时隔两年三代模型更新,我们还是不断感受到大模型的局限。

gpt-4、gpt-4o、o1 模型的技术报告里附上的 “贡献者”(contributions)名单是我们研究的起点。为了让分析更完整,我们还纳入了 gpt、gpt-2、gpt-3 三代论文的作者,以提供对比视角,总共 631 人。

我们以 “人名 +openai” 为关键词,生成 linkedin 搜索链接,人工挨个找有效的 linkedin 主页——大模型无法帮我们完成这个繁琐的工作。用 proxycurl 的 api,我们抓取了有 linkedin 主页贡献者的工作和教育经历,用 r 语言清洗数据,让大模型根据工作内容描述给职能分类,再人工校对。

没有 linkedin 主页的贡献者,我们再次用大模型搜寻,但信息不全或过时,最终用原始且可靠的方法:人工在搜索引擎上找出媒体报道和社交网络页面,补充约 10 人的数据。我们还用开源 python 库 scholarly 增加了其中 214 人的 google 学术数据,评估他们的学术影响力,最终建成 583 位贡献者的数据库。

gpt 迭代,openai 换血

2015 年 12 月,openai 成立,定位为非营利 ai 实验室,仰仗 “开发造福全人类的安全 agi” 的信仰和埃隆·马斯克(elon musk)的名头从 google 等巨头互联网公司抢人,一年多就组建一支 50 多位技术精英组成的研究团队:除了发起者阿尔特曼,还有 ai 浪潮奠基者之一、google brain 负责人伊尔亚‧苏茨克维(ilya sutskever)、硅谷新兴独角兽 stripe 的 cto 格雷格·布洛克曼(greg brockman)、新生代 ai 研究天才安德烈·卡帕西(andrej karpathy)等研究者。

成立早期,这个团队做出过单手玩魔方的机器手,研究过打 dota 的 ai,最后在语言理解世界的方向上看到 ai 改变人类生活的可能。2019 年,他们押注大语言模型。

从 gpt-1 到 gpt-2、gpt-3,模型参数从 1 亿扩展到 1750 亿,成本投入越来越多,贡献者从 4 人增加到 30 人,为了筹集资源,公司不得不向非营利转型。

这 30 多个为 chatgpt 打下基础的研究人员,其中 2/3 已经离开了 openai。截至 10 月,583 位贡献者名单里的 80 个已不在 openai 任职,包括 20 多位创始团队成员和中高层。

“最引人注目的人工智能系统,除了需要算法创新,还消耗最多的计算资源,”openai 曾在一篇文章中写道,“接下来几年,我们要投资数十亿美元采购云计算资源,吸引并留住有才能的人。”

矛盾的是,每一次公司成功筹集更多资源,就会引发一轮贡献者们的离开。前 openai 首席安全研究员达里奥·阿莫迪 (dario amodei) 曾谈到这一矛盾的核心,他们担心 “商业利益影响安全优先级”。

贡献者们的第一次成批离开在 2020 年初。那时阿尔特曼引入微软 10 亿美元投资,推动 openai 组建营利实体。阿莫迪和一批同事离职,创办 ai 公司 anthropic。那次,openai 失去了 30 个 gpt-3 的论文作者中的 8 个。

阿尔特曼信奉 “经济增长能让民主更普遍” 的理念,追求增长是这个前 yc 创业导师经营一家公司的本能。2022 年 11 月 29 日 chatgpt 上线,openai 又从微软融资百亿美元,并在 2023 年 11 月开了一场神似早期苹果的发布会,阿尔特曼仿佛成为新一代技术公司明星。

然而不到一个月后,追求增长和商业规模与造福人类的 agi 信仰的路线矛盾在公司内彻底爆发,并以一个超级戏剧性的方式震惊世界——时任首席科学家的苏茨克维联合董事会突然宣布驱逐阿尔特曼。

“他多次提供关于安全措施的不实信息,董事会基本无法了解安全措施的运行效果,也无法判断哪些方面可能需要改进。” 参与行动的 openai 的董事的海伦·托纳 (helen toner) 说。

仅仅五天,这场令全球震动的变革就迎来结局,阿尔特曼赢了。他重返公司,而董事会多数成员辞职。半年后,苏茨克维离开 openai,又一次引发一批在意安全的贡献者离开。

阿尔特曼仍坚定地推进下一步:把 openai 彻底变成一家营利公司。

新的 openai,从大厂中来

新旧交替,openai 吸引人才的方式也发生转变:用丰厚的薪酬与 google、meta 等竞争人才。2023 年初, openai 已经给应届博士毕业生开出 80 万美元年薪,资深的研究者年薪还可以高几倍,能和一年利润几百亿美元的 google、meta 相比。

钱成了掌控人才的驱动力,也是留不住人的定时炸弹。只要公司停止增长,薪酬就成了负担,期权也失去吸引力。选择了商业路线的代价变得清晰。现在,追求增长不只是阿尔特曼的追求,也是维持 openai 经营的根基。

新来的人不仅重新塑造这家公司的团队,也重塑 chatgpt 这个产品。

完整参与 gpt-1 到 gpt-o1 研发的只有苏茨克维一人。他的离开让有类似经验的元老只剩下阿列克·拉德福德(alec radford)。拉德福德参与过 gpt-1 到 gpt-4o 的研发,他于 2016 年加入 openai,是最早把 google 提出的 transformer 架构用到大规模语言训练的研究者之一,也是确立了当前大语言模型的训练模式的人之一。

“只有阿列克·拉德福德离职,才能确定 openai 垮定了。” 大模型公司 stability ai 创始人伊马德·莫斯塔克 (emad mostaque) 曾在社交媒体上说。

近两年迅速加快的人才流动推着 openai 快速适应所有创业公司必经的阶段——因为重要人物创造出产品而崛起的公司,必定在发展中让个体不再具有决定产品生死的作用。

openai 的新模型仍在稳定地推向市场,gpt-4o、o1 两代模型的核心贡献者共有 390 人,超过 70% 在 chatgpt 发布以后加入公司,他们塑造了新的 openai。事实上,高薪的确解决了元老流失的阵痛问题。2023 年 11 月斗争之后的 3 个月,是 gpt-4o、o1 两代模型贡献者入职高峰期。

openai 的招聘策略没有完全延续刚成立时马斯克给出的提议:重点招揽还未毕业但很聪明的学生,“最好让他们在取得突破性成果之前让他们加入”。chatgpt 发布后加入的贡献者, 只有 10 多位应届毕业生。

新的贡献者们主要从大厂而来,54% 在美国七大科技公司工作过。

创业早期,openai 凭借信仰吸引一批大厂员工加入。但在 2017 年到 2020 年期间,openai 几乎难以维持经营,没有多少大厂员工愿意加入。这些年也是 openai 招人的低谷期。

到了 2023 年,openai 成为下一个科技大厂的机率看着更高了,对大厂员工的吸引力大幅增加。有大厂工作经验的贡献者,超过 40% 在这一年加入,远超以往水平。

在 ai 领域有深厚积累,但在大模型领域动作迟缓的两家公司——google 和 meta 为 openai 输送了最多的贡献者,分别是 119 人和 103 人,仅这两家就占整体近四成。

他们也为 openai 贡献了技术骨干。gpt-4、gpt-4o、o1 三代模型中,一共有 118 名 lead,在 google 和 meta 工作过的占比 45%。

再往后就是 yc 系公司,stripe 排在第三,dropbox 排在第五,再加上 airbnb、instacart、twitch、cruise 等公司,一共输送了 59 人。这些公司都有着与阿尔特曼相近的价值观:增长高于一切。

阿尔特曼曾在社交媒体上说,他很感兴趣的大学替代方案是:“找出全球最聪明、最有进取心的 18 岁年轻人,给他们 10 年以上的薪水和资源,让他们做自己想做的任何项目,配上聪明的同龄人——换他们未来收入里的几个百分点。”

在 openai,他的偏好映射到员工的教育背景上。openai 的贡献者中,我们找到了其中 543 人的毕业学校,绝大多数都来自顶级高校,斯坦福大学、加州伯克利、mit 的毕业生就占三成。中国高校的毕业生也有较强的存在感,清北两所高校毕业生有 20 多人。

高层大清洗,阿尔特曼的班底

2017 年,刚成立两年的 openai 就讨论过是否转型为营利机构,马斯克和阿尔特曼争着当 ceo,负责日常工作的苏茨克维和布洛克曼抵制马斯克,但也怀疑阿尔特曼的动机。

在一封邮件中,他们把疑问直接丢给阿尔特曼:“我们无法完全信任你的判断 ...... 我们不明白为什么 ceo 的头衔对你如此重要 ......agi 真的是你的主要目标吗?它与你的政治野心有什么联系?”

受抵制的马斯克愤而淡出,但阿尔特曼则凭 “对非营利机构仍然充满热情” 的表态争取了信任,并扩大了在 openai 的影响力。

openai 后来的发展证明苏茨克维他们的直觉并没有错。阿尔特曼所谓的 “非营利机构热情” 只持续两年就开始消退。

自从如愿当上 openai ceo,阿尔特曼更是放开手按照自己的设想改造 openai。

2020 年 11 月,gpt-3 模型论文发布半年,阿尔特曼任命了 openai 第一个产品副总裁彼得·韦林德(peter welinder),负责把 gpt-3 模型做成 api 产品对外销售。不久,阿尔特曼又从 facebook 挖来曾担任美国副总统的高级政策顾问安娜·马坎久(anna makanju),负责政策和公关工作。后来马坎久用外交事务上的经验,为阿尔特曼安排了走访全球会见各国政要的行程。

这一轮高层变动相对温和,比较大的连锁反应是研究副总裁、负责安全研究的达里奥·阿莫迪等离职创办了 anthropic,但核心团队仍算稳定。

chatgpt 发布之后,openai 获得微软的 100 亿美元投资,阿尔特曼再一次拔高产品增长和商业化的地位,半年内挖来 3 位副总裁负责相关事项:

  • 斯里尼瓦斯·纳拉扬(srinivas narayanan),2023 年 4 月加入,负责 chatgpt 和各代模型的 api 搭建的工程工作。此前他在 facebook 负责类似工作。

  • 邓修平(peter x. deng),2023 年 5 月加入,负责 chatgpt 和 chatgpt 企业版的产品。之前他在 facebook 干过 10 多年产品经理,后来在数据库公司 airtable 当产品负责人。

  • 克里蒂卡·穆图库马尔(krithika muthukumar),2023 年 8 月加入,负责 openai 产品 gtm 工作。此前她在 dropbox、stripe 等 yc 系公司工作 10 多年,做市场营销。

原来的产品副总裁彼得·韦林德调岗负责新产品开发,openai 的在产品上的高管数量追上技术高管。

之所以没超过,不是因为克制,而是有外部制约。以首席科学家苏茨克维为首的研究团队对 “安全的 agi” 有着宗教般的狂热。《大西洋月刊》的一篇报道中写道:苏茨克维会在线下聚会中带着员工高呼 “feel the agi!feel the agi!”,他也是 openai “超级对齐项目” 的组织者,追求安全。

苏茨克维后来的驱逐行动失败,给了阿尔特曼扩大影响力、全面掌控 openai 的机会。2024 年,openai 的高管层进入大规模清洗期:

  • 2 月,创始团队成员安德烈·卡帕西回归 openai 后再次离职。

  • 4 月,人力资源副总裁黛恩·尹(diane yoon)离职。

  • 5 月,苏茨克维离职。

  • 8 月,一年前刚加入的产品副总裁邓修平离职。

  • 9 月,联合创始人约翰·舒尔曼(john schulman)、 cto 米拉·穆拉蒂(mira murati)、研究副总裁鲍勃·麦克格卢(bob mcgrew)、研究副总裁巴雷特·佐夫(barret zoph)离职。

  • 11 月,研究与安全副总裁翁荔(lilian weng)离职;总裁布洛克曼结束 3 个月休假回归公司,将调岗到新的职位。

同时,阿尔特曼从外部挖来了首席产品官、首席财务官、首席人力资源官,并提拔忠诚的下属担任要职。比如在驱逐风波中号召员工表态 “不让阿尔特曼回归,就辞职加入微软” 的关键人物陈信翰(mark chen)连升两级,从研究主管成为研究高级副总裁。

回顾这两年的人来人往,真如阿尔特曼在 11 月的一场访谈中说的 “openai 快速走完了中大型科技公司通常需要十年甚至更长时间才能走完的发展历程”。如今,它已经是一个毫无疑问的商业公司,仍在扩展产品、运营和设计团队,谋划这个公司的下一个明星产品。

openai 把 agent (智能体)视为明年最重要的事项,目前至少有 3 个相关产品正在开发,预计最早会在明年 2 个月上线一个。

不过 agent 的竞争压力要比大模型更大。它的逻辑是让大模型充当调度员,理解用户的需求,自动调度数据库和工具完成复杂任务。agent 可以充分发挥大模型的能力,但依赖 google、meta、微软等大公司把持的软件生态。在这个方向上,openai 已经慢了 anthropic 半拍,后者在 10 月就展示了相关的工具,正在推行大模型调用和传输数据的标准。

命运的诡谲之处在此显现:anthropic 正是离开 openai 的贡献者们创造的行业新秀。

ai 公司的 “黄埔军校”,从前的 openai 给今天的自己培养对手

chatgpt 发布两年,openai 的估值从不足 200 亿美元蹿升到 1570 亿美元,成为世界第三大超级独角兽,排在它前面的是成立 12 年的字节跳动和成立 22 年的 spacex。

“批评山姆和 openai 很容易,但请记住,chatgpt 不过只有 20 多个月的历史。” 参与 openai 最新一轮融资的硅谷知名风投家布拉德·格斯特纳 (brad gerstner) 说,“这是一艘前所未有的火箭。”

2022 年,美联储结束疫情时代的降息策略,风险投资热情冷却。根据市场调研机构 cb insight 数据,这年三季度,全球 ai 投资跌到两年以来的最低值。

临近年底出现的 chatgpt 维持住了全球 ai 投资。两年间,1320 亿美元资金涌入 ai 公司,平均每个季度催生 6 个独角兽。

虽然阿尔特曼为了 openai 离开了创业孵化器 yc。但回顾过去两年,他何尝不是以一种意料之外的方式,让 openai 成了一个创业孵化器。只不过这个孵化器越成功,阿尔特曼的处境越困难——openai 孵化的几乎都成了他的对手。

69 位从 openai 离职、有明确去向的贡献者建成了一个 ai 创业生态,甚至是与 openai 对抗的生态——不论是大科技公司还是新兴的技术浪潮中,这个现象都极其罕见。

超过一半人重新创业或加入 ai 创业公司,anthropic 是主要聚集地,此外还有 safe superintelligence、cohere、ai21 lab 等大模型公司;character ai、adept ai 等大模型应用公司;以及 the bot company、light robotics 等 ai 机器人公司。

剩下的贡献者有一部分流向 google、xai、字节跳动等大厂的 ai 部门,以及去高校继续研究 ai。还有一批人,在 openai 估值飞天后,直接去了红杉、a16z 等 vc 基金投资 ai,批量扶持 openai 的对手。

这些对手大多实力强劲。相当一部分创业公司的核心人士就是 openai 的前任高管,凭借着个人号召力,加快了 openai 人才流失速度。如,近期离职的 cto 米拉·穆拉蒂就一直在邀请前同事加入她的新公司。

这些贡献者的离职可以说带动了 ai 市场百花齐放,也带动大模型技术扩散。有 24 位贡献者的论文引用次数超过了 5 万,其中 10 位离开 openai。

chatgpt 和 gpt-4 震惊世界。很重要的原因是绝大多数人都不清楚 openai 怎么做到的。那时的 openai 相当于一个黑盒子。但离职的贡献者们清楚,这些产品的底座就是他们参与开发出来的。

竞争压力前所未有地突出:非营利机构 mert(也是由 openai 离职员工创办的)11 月发布报告,评估大模型解决 7 个 ai 研究问题的表现时,发现在其中 5 个问题上,另一群前同事创办的 anthropic 的大模型 claude sonnet 3.5 表现超过 openai 最先进的模型 o1-preview。

“强大的 ai 迟早会出现,最好让 google 之外的人实现。”2015 年 5 月,阿尔特曼发邮件给马斯克,商量启动一个堪比曼哈顿工程的项目,以打破 google 对 ai 的垄断。他们的担心可以理解,几个月后,google 的 ai 将打败世界围棋冠军,重燃人类对机器具备超级智能的想象。

9 年半过去,openai 确实完成了当年的目标,以两位主要发起人没想到的路径。

题图来源:《晚点 latepost》制