孙立平：衔尾蛇之战：AI能否走出奥罗波洛斯困境？

lameihua · 发表于 3 小时前

　　每天一篇，每天弄懂一个自己感兴趣又不太懂的小问题（《孙立平｜每天一篇，你当文章来看，我当笔记来写》）。今天的问题是：

　　AI能否走出奥罗波洛斯困境？

　　在《现在的文章我也不怎么看了》一文中，我曾感叹，现在网络上原创性的文章已经越来越少，现在的文章我也不怎么看了。

　　这个问题的背景是：

　　人类社会高质量的原生数据，已在2024年就给AI喂完了。虽然网上有很多新数据，但相当一部分是AI自己生成的废数据。当AI的内容成为AI的养料，一个自我吞噬的闭环便悄然形成。

　　在这种情况下，人类的知识生产还能延续吗？这就是我们现在面临的实质性问题。

　　失控的复印机：当AI吞噬自己的尾巴

　　有人曾经做过这样的实验：将一张高清彩色照片放进复印机，复印一次后边缘模糊、颜色暗淡；再用这张复印件去复印，重复这个步骤五次、十次——最后得到的是：纸上只剩下一团模糊的黑影。

　　这样的实验结果，凭我们日常生活的经验，就大体能想象到。但就是这样一个简单的实验，却预示着一个可怕的结论：模型坍缩几乎不可避免。

　　这个实验是在牛津、剑桥、帝国理工和多伦多大学在一项联合研究中进行的。这项实验生动地揭示了模型坍缩（Model Collapse）的本质。更进一步地，该研究小组用Meta的OPT-125m模型输入一段关于14世纪教堂塔楼的文本，第一代输出尚在讨论建筑，第五代跑偏到语言翻译，到了第九代——模型开始用大量篇幅热情介绍黑尾、白尾和蓝尾长耳大野兔这些动物，而这些动物绝大部分根本不存在。

　　Shumailov等人在论文中曾经归结过三类无法完全消除（无法为零）的误差——统计近似误差（有限采样必然丢失尾部信息）、函数表达误差（神经网络无法完美拟合所有分布）、函数近似误差（SGD等优化算法本身的结构偏差）。只要其中任何一类误差存在，坍缩便是一种必然。这就如同临摹一幅画时，每一次临摹都丢失一点点细节，经过若干次临摹后，最终的画作一定会面目全非。

　　Shumailov等人指出，这种坍缩并非是以突然崩溃的方式发生的，而是要经历三个阶段的渐进退化：第一阶段方差消亡，丢失数据分布中的“长尾”，即那些罕见却最有价值的信息；第二阶段错误级联，早期小偏差在后代中放大为“事实”；第三阶段熵死，整个分布坍缩为单一模式，输出为千篇一律的灰色泥浆。

　　数据饥荒与数据污染

　　有人将上述的模型坍缩过程称之为奥罗波洛斯困境。奥罗波洛斯（Uroboros）是古希腊神话中的一条“衔尾蛇”，象征着循环、自噬与永恒回归。在AI领域中，奥罗波洛斯困境这个概念被用来形象地描述这样的一种危机：当人类停止高质量的知识原创，而任由AI在自我复制的闭环中运转时，AI不仅不能持续进化，反而会变成一个吞噬自身创造力的“怪兽”。说得更粗俗一点就是，AI“吃自己拉的东西”，越吃越虚弱。

　　在过去这些年中，奥罗波洛斯困境频繁出现在学术论文中，但现在也开始广泛地出现在其他领域。

　　有研究机构预测，现存高质量语言数据将在2026年前后面临全面枯竭。这是一种含义广泛的数据饥荒：人类数千年积累的知识结晶，在短短几年间便被AI鲸吞殆尽。

　　与此同时，数据污染正以更快的速度蔓延。斯坦福大学2026年AI指数报告显示，自2025年初以来，新发布的互联网内容中AI生成的比例已超过51.72%。在中文互联网上，超过38%的所谓“科普内容”完全由AI生成，未经任何事实核查，在健康、财经、教育等领域，这一比例高达45%。

　　这意味着，网络本身现在已经在成为AI生成的“泥浆”，而大模型又是从这片泥浆中汲取养料的。这样，其奥罗波洛斯困境的宿命已经铸成。

　　现在人们普遍将希望寄托于合成数据，试图用AI自行生产的数据来填补空缺。其描述的前景似乎给人以希望，但有关部门的数据表明，这里存在一个危险的“放大器效应”：训练数据中仅0.01%的虚假文本，就能导致模型有害输出增加11.2%。合成数据这个看似万能的“解药”，本身可能就是加速坍缩的催化剂。

　　AI能否走出奥罗波洛斯困境吗？

　　对此，目前学术界有两种截然不同的看法：

　　悲观派坚持模型坍缩是“数学必然”。他们通过对指数族统计模型的分析已经证明：在封闭循环训练中，模型坍缩几乎不可避免。只要训练数据完全依赖合成内容，退化便是一个不可逆的数学过程。更有学者从更宏大的视角发出警告：若人类写作持续外包给机器，思维边界也将随之缩小。语言不只是表达工具，写作的过程本身就是思考，手指停下来的时候，思维也就会变得缓慢甚至停止。

　　但乐观派似乎已经为走出奥罗波洛斯困境找到了若干可能的突破口。有研究提出，可以用“surplexity”指标衡量训练数据的“新颖程度”，依据自由能原理筛选能让模型“意外”的高质量数据，即不再费心判断一份数据是"人类写的"还是"AI写的"，而是直接判断它对当前AI来说，是不是让AI眼睛一亮的新内容。

　　伦敦国王学院的研究更发现，在1000亿个合成数据中仅加入1亿个真实数据，就能有效阻止模型持续退化；在训练中加入哪怕“一条”来自真实世界的数据，也可能打破模型崩塌的恶性循环。现在，一些新的系统或是能够让AI像程序员一样对自己编写的代码进行“自我批评”和改进，或是可以用严密的数学推导，仅凭模型内部的自我验证机制，就足以在完全合成数据的训练环境中阻止模型崩溃。

　　技术出路：四种可能的设想

　　从收集的资料看，其技术突围出路，至少有如下几种设想。就专业而言，我也不懂，但能看出大体的意思：

　　路径一：注入“黄金种子”，即用少量真实数据打破闭环。伦敦国王学院团队的数学证明揭示了一个近乎“奇迹”的结果：哪怕只有一条真实数据，也足以成为抵抗退化的锚点。只要人类持续生产少量但高质量的真实数据，就能有效遏制模型的自我吞噬。

　　路径二：智力筛选，即用“新奇度”而非“真假”选数据。即前面说到的自由能原理筛选，不依赖于区分人工还是AI生成，而从自由能原理出发，专门筛选那些能让模型感到“意外”的数据。这意味着即使AI生成的内容，只要足够新颖、能为模型提供信息增量，就可能被接纳为有效养分。

　　路径三：自我验证，即在没有外部验证的条件下“自我纠错”。自我验证机制已被证明能在完全依赖合成数据的训练环境中独立阻止模型崩溃，让AI学会建立内部质量置信度，筛选自己的输出。

　　路径四：重构互联网治理，即在数据源头上净化“生态”。2025年全球新增内容中已有超过50%由AI生成。如果不从源头上建立水印、来源标注和内容溯源机制，任何技术手段都无法根除模型崩溃的毒源。业界正在推动的伦理准则和行业安全标准，正是为了在这片即将被泥浆淹没的“海域”中，保留几块干净的清泉。

　　然而，单纯从技术层面突破困境，还远远不够。黄仁勋曾深刻指出：真正可怕的不是AI会写，而是人不会判断。当海量AI生成的内容涌入网络时，被数据污染的不只是模型，还有人类的认知环境——“AI泔水”（Slop）正在模糊真实与虚假的边界，我们的判断力在长期食用这些“垃圾”后正逐渐钝化。

　　这恰恰引向了走出困境的终极答案：如果人类持续生产少量但珍贵的真实数据，同时强化自身的判断力、创造力和提问能力，那么AI就永远不会陷入“奥罗波洛斯困境”。黄仁勋所说的“判断力”，正是打破衔尾蛇循环的那把钥匙。因为AI可以生成无穷无尽的内容，却永远无法替代人类对价值的判断——什么值得被记录、什么值得被传承、什么值得被珍视，这些定义权从未交给过机器。

　　问题的关键，是人类是否愿意继续成为那个提供“黄金种子”、保持独立思考的创造者。倘若人类放弃了书写、思考与判断，AI的自我吞噬便不再是AI的问题，而是文明的退场。

		自动登录	找回密码
密码			立即注册

孙立平：衔尾蛇之战：AI能否走出奥罗波洛斯困境？

浏览过的版块