戍天九思：马斯克离场与哈萨比斯警告：美国AGI路线，一...

lameihua · 发表于 2026-5-14 08:30:48

　　2026年5月7日，埃隆·马斯克宣布xAI正式解散，整体并入SpaceX，并更名为SpaceXAI。建成的Colossus1超算集群——搭载22万张GPU、算力规模达300兆瓦——被转租给Anthropic。这家曾估值2300亿美元的明星公司，在两年多时间里发布了Grok-1至Grok-4系列模型，一度与OpenAI、Google、Anthropic并称为“AI四极”。而今由“做模型”变成了“卖算力”，联合创始人也于2026年3月底离任。

　　xAI的退出不仅是一家公司的退场，它撕开了一个更根本的问题：美国AI行业过去几年的竞争逻辑，是不是从一开始就建立在错误的地基上？甚至是否意味着AI泡沫破灭的开始？

　　一、资本与算力堆不出护城河

　　xAI的崩塌绝非孤立事件。就在本轮财报季，美股六大科技巨头合计资本支出将突破7000亿美元，其中约四分之三投向AI基础设施。这是一场以“烧钱”为底色的军备竞赛，当人们以为拥有最强算力集群就自动拥有了未来时，DeepSeek V4用一种截然不同的叙事逻辑打破了这种幻觉。

　　DeepSeek V4发布于2026年4月24日，总参数跃升至1.6万亿，全系标配百万token上下文，V4-Pro输出价格为每百万token仅24元人民币，大约是竞品的三分之一甚至更低。最具颠覆性的信号不在技术参数内，而在于其算力来源：DeepSeek把整套系统从英伟达CUDA生态迁移到了华为昇腾芯片上，且发布当日已完成首发适配。这直接消解了“禁止先进芯片出口就能锁死中国AI发展”这一核心假设。

　　然而，算力竞赛真正的天花板并非芯片，而是电力。2026年，AI数据中心的用电需求正逼近全球电力增量的极限。仅北美地区，在建及规划中的AI数据中心总耗电量预期将在2028年突破300太瓦时——相当于日本全年用电量的一半以上。得克萨斯州、弗吉尼亚州等算力重镇已出现工业电价翻倍式跳涨，而电网扩容周期长达5至8年，远远跟不上GPU到货速度。今夏已有3家头部云厂商推迟了新集群上线时间，原因不是缺卡，而是当地电力公司明确告知：无法保障供电。

　　这意味着，靠堆算力构建护城河的模式正撞上物理世界的硬墙。你不是有钱买卡就能赢——你还得抢得到变电站的接入许可。而当算力的边际成本因电力约束而急剧升高时，拼“更大集群”的ROI拐点就提前到来。xAI的Colossus集群纵然坐拥300兆瓦算力，在电力成本高企、用户增长无法独立消化产能的压力下，这座巨型耗电机器从资产变成了失血的伤口。

　　DeepMind创始人、诺贝尔奖得主、“AlphaGo之父”哈萨比斯在今年1月达沃斯论坛上不得不承认：中国AI能力与美国的差距已从一两年前的一到两年，缩短到如今的6到12个月。但他紧接着给出了一个更具攻击性的判断——“他们还没有展现出超越前沿的创新。下一个Transformer、下一个AlphaGo，至今仍来自西方。追赶前沿比推动前沿容易得多。那才是未知的部分”。换言之，中国的确跑得更快了，但跑的仍然是一条别人修的路。

　　二、“AI教父”的诊断：拼规模，方向错了

　　哈萨比斯作为认知神经科学家深知：人类大脑的很多功能——长时记忆、目标规划、元认知、真正的好奇心，不是把参数堆到一万亿就能自动涌现出来的。他在2026 年 4 月29日YC访谈中，对当前AI行业的路径依赖表达了更深层的忧虑。他罕见地说：“我们2010年创立 DeepMind 的时候，设想的是一条用神经科学启发、专业化、一层一层搭上去的路径。现在走的是另一条路。有一些能力确实出来了，但代价巨大，而且最关键的那些能力——真正的规划、真正的创造力、持续学习，可能不在这条路的延长线上。”——华为盘古大模型走的就是这条路。

　　这与xAI的失败形成了内在呼应。xAI尽管坐拥全球领先的Colossus集群并推出Grok-4系列模型，但用户增长始终无法独立消化巨量算力资源，在模型性能与开发者生态的竞争上被OpenAI、Google持续拉开差距。哈萨比斯的诊断恰好解释了这一结局：当行业把几乎全部资源押注在“更大算力+更多参数”的单维度竞赛上，它本质上是在试图用数量级覆盖质量级的问题，而真正的入口可能藏在完全不同的方向上。

　　三、DeepSeek的“第三条路”

　　DeepSeek V4的发布会上有一个有趣的细节：技术报告主动写明V4仍落后于GPT-5.4和Gemini 3.1 Pro约3至6个月。在一个以“全球领先”为发布标配的行业里，这种坦白极为罕见。但恰恰是这种承认差距的姿态，背后是一套完全不同的大模型竞争哲学——不打“全球最强”的牌，而是打“成本渗透”和“开发者主权”的牌。

　　V4采用CSA（压缩稀疏注意力）与HCA（重度压缩注意力）混合架构，同样处理一百万字内容只需前代模型的四分之一算力和十分之一显存。DeepSeek不是不想做最强模型，它清醒地选择了另一条道路：在“突破前沿能力”这件事上承认滞后，而在“把前沿以下的能力变成所有人的基础标配”这一维度上做到了极致。CNN旗下CGTN的评价一针见血：“DeepSeek不是在构建最强大的模型，而是在构建最实用的模型”。

　　这恰好敲中了哈萨比斯最新判断的“软肋”——他笃信AGI需要科学级根本创新，但全球AI落地的现实是：绝大多数应用场景根本等不起这个十年。DeepSeek以MIT协议开源全部模型权重，用1.6万亿参数将工业级AI体验的成本打到了历史最低。当调用一次API的成本已低于企业内部的审批成本时，所谓的“前沿能力差距3到6个月”已不再是要害，真正致命的是“用得起还是用不起”。

　　四、硅谷的“闭源内卷”走不动了

　　xAI瓦解之后，美国AI竞争格局骤然变为OpenAI与Anthropic的双雄对决。马斯克将xAI的22万张GPU租给Anthropic，使得后者在算力上的优势进一步集中。但这两家公司之间存在一条无法弥合的裂痕：从人才到技术到资本，二者长期互相封锁、互相拆台。Anthropic的核心团队本身就来自OpenAI，因理念不合出走，从2023年到2026年两家企业在技术共享上基本是零。

　　把这种“零和博弈”放到中国开源AI的参照系下看，反差尤为刺眼。DeepSeek V4与同周发布的Kimi K2.6之间形成了事实上的技术互哺：DeepSeek的MLA多头潜在注意力技术被Kimi沿用，而Kimi率先大规模验证的Muon优化器则被写进DeepSeek V4的训练方案，实现了“同等训练量下效率翻倍”。这种没有法律纠纷、无需授权协议的正向循环，正在证明一个硅谷不愿承认的事实：当AI成为基础设施层竞争时，“开放”本身就是最强的护城河。

　　而电力瓶颈正在加速这场开源对闭源的逆转。当电力供给成为全行业软约束，谁的算力效率更高、单瓦性能更强，谁就掌握了真正的主动权。DeepSeek V4在昇腾芯片上用CSA/HCA混合架构将同等任务能耗压至前代四分之一，本质上是在“电力稀缺”的时代重构了成本结构。反观硅谷，Anthropic接手xAI的300兆瓦集群后面临一个尴尬问题：在加州或德州电网找到稳定供电的成本，可能比租GPU本身更贵。

　　哈萨比斯罕见地承认了这一点。他在一次访谈中坦陈，今天的AI节奏被商业压力和地缘政治推着跑，并不是他理想中的路径。如果由他定，他会把AI在实验室里再多留十年，用CERN式的协作方式稳健推进AGI。这句话揭示了一个更深层的矛盾：美国AI的“正确方向”从来不在技术层面，而在战略哲学层面。中国选择“应用驱动+工程适配+开源协同”，美国却选择了“资本垄断+闭源竞争+出口管制”。哈萨比斯的存在证明美国并非没有远见者，但在7000亿美元资本支出和电网告急的现实语境里，他的声音很难盖过资本的轰鸣。

　　五、什么才是AGI对的路？

　　DeepSeek V4证明了一件事：即使用次一级的芯片，通过极端工程优化和开源协同，也可以把大模型体验打到普通开发者用得起的水平。xAI的退场则证明了另一件事：坐拥全球最昂贵算力集群，如果没有独特的技术定位和可持续的商业逻辑，“算力即权力”就是伪命题。而2026年日益迫近的电力天花板，正在为这个判断添加最冷峻的脚注——下一阶段AI的洗牌，将不仅取决于谁有卡，更取决于谁用得起电、谁把每度电都用出了最高的智能密度。

　　DeepSeek在技术报告中坦诚落后前沿3到6个月，并非示弱，而是对传统“闭源最强”叙事的告别。真正该回答的问题是：一条先封锁别人、再垄断算力、最后靠资本密度碾压一切的路径，能通到AGI吗？xAI用两年的高调崛起和一夜解散，已经交出了答卷。剩下的，就看2026年的AI牌局，还有谁手里捏着不一样的牌。

		自动登录	找回密码
密码			立即注册