机器之心编译
去年 1 月底,在一次白宫新闻发布会上,特朗普和 OpenAI CEO Sam Altman、软银 CEO 孙正义等人联合宣布了一个名为「星际之门」(Stargate Project)的人工智能项目。
该项目计划在未来四年内投资高达 5000 亿美元,为 OpenAI 在美国建设新的人工智能基础设施。当时承诺将立即投入 1000 亿美元,并打造 10 吉瓦(GW)的超级计算基础设施。
目标很远大:建设起来的基础设施将确保美国在人工智能领域的领导地位,创造数十万个美国就业岗位,并为全球带来巨大的经济效益。
然而,一年多时间过去了,项目进展究竟怎样了?
近日,外媒 The Information 的一篇报道,揭露了这场野心勃勃的 AI 军备竞赛正在经历的阵痛。
据三位知情人士透露,在宣布成立后的数周内,Stargate 项目基本处于停滞状态。原因在于:OpenAI、Oracle 和软银三方在领导权归属、任务分工以及合伙架构上产生了严重分歧,导致协作机制形同虚设。
其中,急于获取算力的 Sam Altman 一度决定摒弃合作伙伴,尝试「单飞」。当时,OpenAI 计划直接租赁甚至自行建设大型数据中心园区,从而减少对云服务商的依赖,掌握绝对的算力控制权。
然而,由于 OpenAI 每年烧钱数十亿美元,且商业模式尚未得到充分验证,债权人对直接支持这样一家高风险公司承建百亿级项目持怀疑态度。
根据 The Information 披露的后续细节,在面临严峻的财务现实后,OpenAI 不得不重新回到谈判桌前,向软银和 Oracle 寻求合作。
但是,合作的形式发生了微妙的变化:所谓的「三方合伙」名存实亡,取而代之的是 OpenAI 与软银、OpenAI 与 Oracle 分别达成的双边协议。
在上个月的达沃斯世界经济论坛上,OpenAI CFO Sarah Friar 明确释放了转型信号,「我们正利用云合作伙伴来保持资产负债表的『轻量化』,目前我们还没到完全自建的阶段,并且我们拥有优秀的合作伙伴。」
与此同时,OpenAI 内部的基础设施部门也经历了一场人事洗牌。
去年 11 月,OpenAI 挖来了原英特尔首席技术官兼 AI 业务负责人 Sachin Katti,由其负责打造支撑 AGI 的计算基础设施。据知情人士透露,Katti 目前正在对计算部门内的多个小组进行大刀阔斧的重组。
The Information 进一步引述了 OpenAI 内部员工的消息,尽管自建数据中心已不再是短期内的重点,但公司仍希望通过 Stargate 这一名义,在基础设施协议中植入特殊条款,以确保其对数据中心设计的深度参与和特权。
也许正如星际之门项目刚公布时,马斯克所评价的那样,「他们根本就没钱」。
目前,OpenAI、Oracle、软银均未回应 The Information 的置评请求。
从狂想走向现实,OpenAI 的算力「阿喀琉斯之踵」
我们很难明确判断 Stargate 项目的推进受阻,是否直接拖慢了 OpenAI 模型能力的迭代节奏。
但从 OpenAI 最近一段时间的表现来看,其所承受的压力显然不小。
一方面,算力获取的不确定性与成本飙升持续挤压公司的利润空间。为了维持模型迭代速度,OpenAI 不得不在多个云平台之间进行算力调度。据知情人士透露,原本预计到 2030 年的 4500 亿美元算力投入,如今已上调至 6600 多亿美元,在生成式 AI 仍处于重投入、轻变现阶段的当下,这种现金流压力并不轻松。
另一方面,来自谷歌和 Anthropic 的压力进一步加大。Google 凭借自研 TPU 芯片与深厚的云计算基础设施,将模型训练与推理成本压到更具优势的位置;Anthropic 则在代码大模型领域打出自己的特色。相比之下,OpenAI 在算力布局上更多依赖外部合作,其对资源的掌控程度尚未形成类似 Google 那样的垂直整合算力体系,这也使其在战略推进上必须更加审慎。
在 Stargate 推进节奏不及预期的背景下,OpenAI 面临的压力明显上升。
自从 Stargate 计划公布后,OpenAI 内部迅速进入筹备状态。但合作架构一直不清晰,Oracle 与软银在其中扮演何种角色,职责如何划分,始终没有形成统一方案。
在内部讨论中,有高管提出另一种思路:将 Stargate 打造成一个相对独立的基础设施平台,由该平台负责数据中心建设,再通过租赁形式向 OpenAI 提供算力资源。按照这一设想,部分 OpenAI 团队成员甚至可能转入该实体,以强化项目执行能力。同时,也有人提出将 Stargate 作为融资工具,用于为芯片采购和基础设施建设筹集长期资本,使其不仅是工程项目载体,也成为资金运作的平台。
最初,OpenAI 确实认真考虑过全面自建数据中心的路径,并在全美范围内考察选址、测算成本,希望在算力资源上实现更强的自主掌控。但在完成融资测算后,公司意识到,如果由自身承担建设与融资责任,资金成本将显著偏高。相比之下,由信用评级更高的合作方出面签约、再向 OpenAI 提供算力资源的模式,整体财务压力更可控。
随后,OpenAI 与 Oracle 达成一项覆盖 4.5 吉瓦电力容量的重大合作协议。不同于逐个园区签约,这一结构允许在多个项目之间分摊风险,并通过风险共担机制降低不确定性。为此,OpenAI 一度暂停了自建推进计划,将部分原本考察的园区交由 Oracle 主导开发。
图源:OpenAI
在德州一处 1 吉瓦规模的园区项目上,OpenAI 则与软银展开合作。双方在控制权与所有权问题上经历多轮谈判,最终达成折中方案:由软银旗下公司负责开发和持有资产,OpenAI 签署长期租约并掌握数据中心设计主导权。这意味着,公司短期内不再追求完全自建拥有,而是转向一种掌控架构但不承担全部资产风险的模式。
整体来看,OpenAI 的算力战略发生了明显转向,从最初的自建与拥有,调整为控制与协作。
Stargate 将如何发展,我们拭目以待。
参考链接:
https://www.theinformation.com/articles/inside-openais-scramble-get-computing-power-stargate-stalled