据《金融时报》报道,由于无法提供社交媒体巨头所需的庞大计算能力,谷歌(Google)已对其竞争对手 Meta 使用其 Gemini AI 模型的权限进行了限制。这一限制不仅影响了 #Meta,还波及了谷歌的其他几家大客户,但 Meta 受到的冲击最为严重。
此举对 Meta 的内部项目产生了连锁反应。据三位知情人士透露,Meta 内部已要求员工更加高效地使用 AI Token。目前,谷歌和 Meta 均对此拒绝置评。
起初,Meta 在自动审核安全流程(如清除有害内容和诈骗信息)时高度依赖 #Gemini,因为其效果优于 Meta 自家的开源模型 Llama。然而,随着 Meta 寻求减少对外部 AI 供应商的依赖,该公司正逐步将工作负载转移到其名为 Muse Spark 的新型内部模型上。与此同时,谷歌自身的算力压力也极其巨大,以至于同意每月向 SpaceX 支付高达 9.2亿美元,以租用其 110,000张 Nvidia GPU,并将其称为满足 Gemini Enterprise 激增需求的“桥接算力”。
这一现状表明,AI 算力短缺正在重新塑造行业巨头之间的关系。谷歌拥有全球最大的 AI 基础设施库之一,且今年的资本支出超过了 1800亿美元,但依然无法满足所有客户的需求。谷歌不仅在对 Meta 这样的巨头进行算力限额,甚至还需要向一家火箭公司租赁 #GPU,这向外界释放了最清晰的信号:AI 基础设施的建设速度远未赶上消费需求的增长。
对 Meta 而言,依赖竞争对手的 AI 模型始终是一项让人不安的妥协。Meta 在今年5月裁员 8,000 人,并将数百亿美元的资金重新拨向 AI 基础设施建设,其 2026 年的资本支出预期高达 1150亿至1350亿美元。该公司已将 7,000 名员工重新分配到 AI 相关岗位,并在其超智能实验室(Superintelligence Labs)部门下推出了 Muse Spark。谷歌对 Gemini 的限制,加速了 Meta 既定的战略转型——即从依赖外部前沿模型,转向构建能够处理大规模内容审核等关键工作负载的内部替代方案。
谷歌限制 Meta 访问 Gemini 这一事件,撕开了当前 AI 行业繁荣背后的“算力底牌”。在 AI Agent 走向多模态与自主化(Agentic AI)的今天,底座模型的调用频率和上下文吞吐量呈指数级增长,算力不仅是技术竞争的护城河,更成了生存的硬通货。从技术横向对比来看,尽管 Llama 在开源界处于领先地位,但在特定垂直工程(如高精度内容安全过滤)上,闭源的 Gemini 依然保有优势,这迫使 Meta 不得不短期“寄人篱下”。然而,这也印证了我们的长期观察:任何志在构建全自主 AI Agent 生态的巨头,都无法承受底层推理能力被竞争对手“卡脖子”的风险。Meta 加速自研 Muse Spark 并在内部优化 Token,正是为了确保其未来 Agent 矩阵在应用层的绝对自主权。未来的 Agent 生态将不仅仅是算法的竞争,更是“能源-芯片-模型-端侧应用”全栈垂直整合能力的终极对决。