当前位置：首页 > news >正文

普林斯顿认知科学家发现：AI通不过的那些测试，恰好是人类智能里最重要的部分——他们把这片空白叫做“认知暗物质“

news 2026/5/26 7:13:43

宇宙里有一种东西看不见摸不着不发光不反射任何电磁波。但如果没有它银河系会在自身引力下土崩瓦解。天文学家把它叫做暗物质——不是因为它神秘而是因为它的存在只能从它的缺席里被推断出来。星系转得太快了按照可见物质的质量根本撑不住所以一定有什么东西我们还没看见。2026年3月普林斯顿大学认知科学系、Amaranth基金会和Protocol Labs的三位研究者用完全相同的逻辑描述了他们在AI里看到的一个结构性缺口。他们把它叫做认知暗物质。GPT-5、Claude Opus 4.5、Gemini 3.0 Pro——这些模型能通过律师资格考试能解答奥数题能看一张病理切片给出诊断意见能在一小时内写出一个功能完整的Web应用。但研究者做了一个简单的测试让这三个模型各自运行10次完成同一个任务——写一个包含三道国际象棋一步将死残局的网页应用要有拖拽功能。没有一个模型能稳定通过。原因不是代码能力不够——它们生成的HTML、CSS、JavaScript几乎无可挑剔连拖拽逻辑都完美实现了。失败的地方是它们生成的国际象棋残局本身是无效的。黑方棋子已经被将军了根本还没到白方走棋残局就已经结束了。这是任何一个真正下过象棋的人一眼就能看出来的错误。一个初学者可能不会摆出这样的残局。但AI没有发现。更奇怪的是这个错误在代码层面完全可以被检测出来——这些模型在生成代码时已经导入了能验证棋盘合法性的Python棋类库。它们拥有发现自己错误所需的全部工具只是从来没有想到要用这个工具检查自己的输出。研究者把这个现象起了个名字锯齿状智能Jagged Intelligence——AI的能力不是一个完整的球体而是一个奇怪的形状某些方向上突出得极远某些方向上有令人意外的深坑而且你很难提前预测哪里会是坑。他们的问题是这些坑为什么会在这里要理解这个问题需要先理解AI是怎么被训练出来的。现有的AI模型学习的材料是人类行为的数字痕迹——文字、图像、代码、对话记录。这些都是行为的结果而不是产生这些行为的认知过程。举个例子你在网上看到一篇数学论文最终呈现的是一个完整的证明。但论文背后是什么是作者在某个下午突然想到了一个新思路是他意识到之前的方向走错了然后回头是他在白板前站了两个小时发现了一个别人没注意到的模式。这些东西都没有被写进论文。AI学的是那个证明不是写出那个证明的认知过程。研究者把那些真正在人类智能运作中发挥关键作用、但很难从行为结果里推断出来的认知能力统称为认知暗物质。就像宇宙暗物质的存在是从星系转得太快这件事被推断出来的——认知暗物质的存在是从AI在某些任务上的表现方式里被推断出来的。那些任务AI完成得很奇怪对的部分非常对错的部分非常奇怪错误的类型不像人类会犯的错更像一个不知道自己缺了什么的系统在盲目推进。研究者列出了他们认为最关键的七个认知暗物质域。这七个能力共同构成了人类智能里那个看不见但撑起了一切的隐形骨架。第一片元认知知道自己知道什么知道自己不知道什么知道什么时候需要停下来检查自己的推断是否正确。象棋残局那个例子里缺失的正是这个——模型生成了棋局但从来没有问自己这个棋局合法吗。它没有一个内置的声音在说等等我在这一步可能犯了错让我验证一下。人类做复杂任务时会有这种内部检查机制即便犯了很多错也能在某个节点意识到这个方向不对然后转向。AI的成功率随着任务步骤的增加呈指数级下降就是因为缺乏这个错误恢复机制——它每一步犯错却不知道自己在犯错然后继续走。第二片认知灵活性当规则变了或者反馈表明当前策略不管用时快速切换到另一种策略的能力。研究者尝试给Claude Code连续反馈告诉它残局是无效的让它换一个思路。失败了——模型反复使用同一种方法哪怕每次都得到了这条路走不通的明确信号。人类碰到这种情况会有一种认知层面的卡住感然后主动寻找为什么卡住、有没有别的思路。这个机制在AI里大体缺失。第三片情节记忆记住这件具体的事是什么时候发生在我身上的然后用这段记忆来指导未来的行动。当前部署的语言模型没有真正意义上的情节记忆。它们有训练数据里蒸馏出来的通用知识但没有我上次做类似任务时犯了这个错误这种可以被检索和利用的个人化记忆。每次对话都是全新开始之前积累的经验教训无法被内化。第四片终身学习在不忘记已有知识的前提下不断学习新东西适应新环境的能力。人类的神经系统在一生中都在持续更新学新技能不会让之前的技能消失。现有的AI模型要更新知识需要在海量数据上重新训练。这被称为灾难性遗忘问题——给模型加入新知识旧知识就被覆盖了。第五片溯因推理从已知的结果推断出最有可能的原因——即便那个原因是全新的、之前从未被明确提出过的。这是科学发现的核心机制。达尔文看到加拉帕戈斯群岛上不同的雀类推断出了自然选择。牛顿看到苹果落地推断出了万有引力。这种从零散观察里跳跃到一个全新解释框架的能力极难被编码进训练数据因为真正的跳跃在它发生之前没有人知道它会在哪里发生。第六片社会常识推理理解人和人之间那些不成文的规则理解他知道我知道他知道什么这种多层嵌套的社会认知。人际交往里有大量的意义是通过沉默、语气、时机传递的而不是通过字面意思。一个真正理解社会规则的系统不需要被明确告知在这种情况下不应该说这种话——它有一个关于人类社会互动的内建模型。第七片情绪智能识别、理解自己和他人的情绪状态并据此调整自己的行为。这不是在问AI有没有感情这个哲学问题。这是在问在一个情绪高度敏感的对话场景里AI能不能感知到对方的情绪信号并给出在情感层面恰当的回应相关事件显示这个能力目前存在相当大的缺口。你可能会问这七件事不就是更多的训练数据或者更大的模型能解决的问题吗研究者的回答是不是因为问题不在于量而在于类型。他们分析了目前最大规模的神经成像数据集发现了一个让人警觉的模式那些已经被AI掌握得很好的认知能力视觉感知、语言理解、语言生成有大量专门为AI训练而设计的大规模神经数据集。那些AI还完全没有掌握的认知能力元认知、认知灵活性、情绪智能对应的大规模数据集几乎不存在。这不是偶然。AI研究者收集和使用那些容易被测量、能产生明确正确或错误答案的数据。元认知发生在内部通常不留痕迹溯因推理的灵感时刻稍纵即逝无法被大规模记录情绪智能的微妙信号很难被标注成训练标签。结果就是AI学会了大量可以被测量的东西但那些真正塑造人类行为、但难以被测量的东西从来没有进入过任何训练集。研究者还做了另一个分析检查了GPT-5.2、Claude Opus 4.5、Gemini 3.0 Pro的发布文档里用到的所有评测基准——37个基准分析每一个主要在考察什么认知能力。结果几乎所有基准都集中在中等难度的认知能力层级对真正困难的认知暗物质域的测试几乎为零。换句话说AI在哪些方面进步取决于我们在哪些方面给它出卷子。我们没有出这七道题所以这七块地方从未被认真建设过。论文里有一段话读完之后会停在脑子里问题不只是任务失败而是失败的方式。在一个精良的象棋应用里硬编码了无效残局不只是错误更是陌生的。人类犯错有规律可循忽略边缘案例算术出错注意力涣散。这些失败模式是可被理解的这让协作成为可能。以不可预测的方式失败的AI很难被整合进人类的社会网络。目标不只是减少失败而是确保失败是可被发现和可被解释的。这句话说的是一件比能力本身更根本的事可靠性的前提不是永不出错而是出错的方式让人能看懂。一个人类同事犯了错你大概能理解为什么——太累了信息不够理解有偏差。你知道下次怎么补救知道在哪些环节多核查。这让人类之间的分工成为可能。一个缺乏认知暗物质的AI犯了错那个错误经常是莫名其妙的——它做对了99个步骤然后在第100步犯了一个初学者都不会犯的错没有任何预兆没有任何你能事先检测到的信号。这不只是技术问题这是人机协作的根本挑战。这篇论文最后的结论有一种不常见的诚实研究者承认他们提出的解决方向——收集大规模的过程数据、眼动追踪数据、神经成像数据来训练AI学习认知过程而不只是行为结果——可能来不及在常规AI研究进展之前发挥作用。如果scaling law继续下去也许这七片暗物质会在某个未知的方式下被部分解决而不需要等待神经科学数据的介入。但他们认为即便如此这项研究依然值得做。原因是双重的一方面这些数据能帮助AI变得更通用、更少锯齿。另一方面这些数据能帮助我们更好地理解人类自己的认知是怎么运作的——元认知究竟发生在大脑的哪个部位情绪智能的神经基础是什么溯因推理时大脑里在发生什么。研究AI缺什么结果帮我们更清楚地看到了人类有什么。这个视角让这篇论文的意义超出了单纯的AI研究边界。回到开头的那个比喻。宇宙暗物质之所以重要不是因为它神秘而是因为如果它不存在我们观察到的宇宙就无法成立——那些星系根本不该转得那么稳定那些结构根本不该那么完整。认知暗物质之所以重要是同样的逻辑如果这七种能力真的只是可有可无的附加功能那人类就不该如此稳定地在复杂的、不确定的、充满情感张力的真实世界里生存和合作。它们一直在那里支撑着我们只是在AI被设计出来之前我们从来没有需要给它们一个名字。原论文Patrick J. MineaultAmaranth基金会、Thomas L. Griffiths普林斯顿大学、Sean EscolaProtocol Labs《Cognitive Dark Matter: Measuring What AI Misses》arXiv:2603.034142026年3月5日

查看全文

http://www.gsyq.cn/news/1388221.html