元鉴
返回中文阅读流

Microsoft Research Blog

通过 AI 延展人类智能

将 AI 理解为人类智能的延展而非替代,为构建可信 AI 系统提供了更扎实的路径。

中文内容

已翻译official company source英文原文2026-05-27
Three icons (speech bubble, handshake, and interconnected circles) on a blue and green gradient background.

概览

  • 现代 AI 系统之所以强大,并不是因为它们复制了人类智能,而是因为它们以人类智能为前提,延展了人类认知和语言中已有的结构。
  • 这一视角有助于解释 AI 的非凡能力及其反复出现的边界,包括幻觉和推理失效。
  • 这项研究认为,AI 安全是一个系统层面的挑战,应将注意力从“失控 AI”的叙事转向利用工程与治理手段。
  • 将 AI 理解为人类智能的延展,而不是其替代品,为构建可信 AI 系统提供了一条更扎实的路径。

如今的 AI 系统能够撰写文章、生成代码、总结复杂观点,并以惊人的流畅度进行对话。然而,这些同样的系统仍难以完成在人类看来很直观的任务:可靠地追踪变化中的物体、在陌生情境中进行组合式推理,或区分真实与看似合理的虚构。这些矛盾引发了关于 AI 的两极化争论。有些人将当前系统视为类人智能的早期形式;另一些人则将其贬为复杂的自动补全。

在近期的跨学科研究中——包括 Adam Frank、Marcelo Gleiser 和 Evan Thompson 的 The Blind Spot(在新标签页中打开),以及 DeepMind 研究员 Alexander Lerchner 的 The Abstraction Fallacy(在新标签页中打开)——一种不同的图景正在浮现。与其追问 AI 系统是否正变得具有人类意义上的智能,这些方法提出了一个更基本的问题:如果 AI 系统之所以能运作,是因为它们依赖于植根于人类认知的结构呢?这种受 Edmund Husserl 现象学启发的视角转变,有助于理解现代 AI 的能力与局限。

在我们最近的论文 The Origins of Artificial Intelligence in Natural Intelligence 中,我们认为,现代 AI 系统既不应被理解为人类心智,也不应被视为微不足道的统计把戏。相反,它们延展的是源自人类认知本身的结构。论文进一步借鉴 Husserl 的现象学,提出语言已经包含了人类理解的沉积结构——这些结构是 AI 系统学习建模并加以延展的对象。这一视角有助于解释当代 AI 的能力与边界。

人类感知并不是对感官数据的简单被动接收。我们体验到的世界,是稳定事物在变化中展开:当我们绕着一个杯子移动时,它仍然是同一个杯子;即使一个个音符消逝,旋律仍然可以被辨认。语言通过以概念形式表达这些稳定结构而产生。诸如“红色”“圆形”或“大于”等词语,表达的是源自生活经验的关系。

大语言模型学习的是这一语言世界中的统计关系。它们捕捉概念在海量人类文本中往往如何相互关联。这解释了为什么 AI 系统能够在许多领域给出连贯回应。但这也解释了它们为何会产生幻觉。人类仍需对世界负责:经验会不断修正我们的预期和信念。相比之下,AI 系统延展的是文本内部的模式。它们能够以惊人的流畅度延续一条推理线索,但缺乏那种使意义和真理扎根的、与世界的生活性接触。

How AI extends human cognition | diagram
AI 延展人类认知

这一框架有助于解释 AI 研究中反复出现的若干挑战。其中之一是“组合性鸿沟”——语言模型在熟悉的推理模式上表现良好,却在被要求以真正新颖的方式组合概念时失败。越来越多的研究显示,更大的模型在流畅度和事实回忆上的提升,远快于在真正组合式推理上的提升。从我们的视角看,这并不只是工程限制,而是一种结构性边界:AI 系统可以延展语言中已经沉积的模式,但并不具备人类那种面向世界的理解,因而无法生成真正新的概念关系。

类似的模式也出现在结合语言与视觉的多模态系统中。这些系统往往能够正确标注图像,却仍然无法对物体及其组成部分进行稳健推理。它们学习的是视觉模式与语言之间的相关性,而不是像人类那样感知在时间中展开的稳定物体。其结果是,系统在熟悉模式中显得流畅得令人印象深刻,但在熟悉模式之外却出人意料地脆弱。

这一视角也重新界定了关于 AI 安全的争论。公共讨论常常在对“失控超级智能”的恐惧与认为 AI 并不构成有意义风险的说法之间摇摆。我们的研究表明,这两种极端都误解了当前系统的性质。最直接的风险并非来自 AI 具有人类般的意图,而是因为它能够延展推理模式,却不承担对世界的反思性责任。系统可能生成有说服力但缺乏根基的输出,大规模自动化有缺陷的决策,或在嵌入治理不善的环境时执行有害行动。

这有助于解释为什么 AI 安全正日益从模型安全转向系统安全。在实践中,组织已经依赖分层保障措施——行业中越来越常称为“harnesses”的机制——来约束、验证和监控 AI 行为。我们的论文认为,这些机制并非临时补丁,而是反映了 AI 架构本身的某种根本特征:可信行为来自 AI 系统构建者对其行为所承担的责任,而这种责任不能委托给模型,也不能与模型共同承担。

这一解释与企业日益采用的可信 AI 部署方式高度一致。组织需要能够延展人类智能、同时仍可治理、可审计并与人类监督保持一致的系统。将 AI 理解为一种派生的智能形式,有助于澄清为什么分层治理、评估和运营控制如此重要。

展望未来,我们认为现象学提供的不仅是对 AI 的批判,也是一种理解其前景的框架。AI 系统揭示了关于人类认知本身的深刻事实:意义可以被形式化、延展,并以强大的新方式扩大规模。因此,AI 的核心社会风险在于割断其源自人类经验与认知的阶梯——将 AI 误解为一种削弱我们人性的竞争性智能,并由此反过来削弱 AI 本身真正的前景。

因此,问题并不在于 AI 是否会取代人类智能,而在于我们如何负责任地构建能够延展人类理解、同时仍扎根于这种理解所由产生的世界的系统。如果我们将 AI 系统误认为自主心智,就有可能过度信任它们;如果我们将其贬为微不足道的把戏,就可能忽视我们这个时代最重要的技术发展之一。更扎实的解释会同时承认这两个事实:AI 是人类智能的真实延展——也正因为如此,人类仍然要对其如何被理解、治理和使用负责。

在新标签页中打开

原文标题

Extending Human Intelligence Through AI