中文内容
Aeneas 改变了历史学家连接过去的方式
Aeneas 团队
文字在罗马世界无处不在——从帝国纪念碑到日常物品,各种载体上都刻有文字。从政治涂鸦、爱情诗和墓志铭,到商业交易、生日邀请和魔法咒语,铭文为现代历史学家深入了解罗马世界各地日常生活的多样性提供了丰富线索。
这些文本往往残缺不全、风化磨损,或遭到刻意毁损。没有上下文信息,修复、断代和定位它们几乎是不可能的,尤其是在比较相似铭文时。
今天,我们在 Nature 上发表了一篇论文,介绍 Aeneas,这是首个用于为古代铭文提供语境化分析的人工智能(AI)模型。
在研究古代铭文时,历史学家传统上依靠自身专业知识和专门资源来识别“平行文本”——即在措辞、句法、标准化套语或来源地方面具有相似性的文本。
Aeneas 极大地加速了这项复杂且耗时的工作。它能够对数千条拉丁铭文进行推理,在数秒内检索出文本和语境上的相似材料,使历史学家能够解读并进一步发展该模型的发现。


我们的模型还可以适配其他古代语言、文字和媒介,从纸草文献到铸币,从而扩展其能力,帮助在更广泛的历史证据之间建立联系。
我们与诺丁汉大学共同开发了 Aeneas,并与华威大学、牛津大学以及雅典经济与商业大学(AUEB)的研究人员合作。这项工作是一项更广泛努力的一部分,旨在探索生成式 AI 如何帮助历史学家更好地大规模识别和解读相似材料。
我们希望这项研究惠及尽可能多的人,因此我们在 predictingthepast.com 免费提供 Aeneas 的交互版本,面向研究人员、学生、教育工作者、博物馆专业人士等。为支持进一步研究,我们还将代码和数据集开源。
Aeneas 的高级能力
Aeneas 以希腊—罗马神话中四处漂泊的英雄命名,建立在 Ithaca 的基础之上;Ithaca 是我们早期利用 AI 修复古希腊铭文、确定其年代和地点的研究成果。
Aeneas 更进一步,帮助历史学家解读文本并将其置于背景中,为孤立的残片赋予意义,得出更丰富的结论,并拼合出对古代历史更好的理解。
我们模型的高级能力包括:
- 平行文本搜索:它会在海量拉丁铭文集合中搜索平行文本。通过将每段文本转化为一种历史指纹,Aeneas 能够识别深层关联,帮助历史学家将铭文置于更广阔的历史背景中。
- 处理多模态输入:Aeneas 是首个使用多模态输入来确定文本地理来源的模型。它会分析文本和视觉信息,例如铭文图像。
- 修复未知长度的缺失部分:Aeneas 首次能够修复文本中缺失长度未知的空缺。这使其成为历史学家处理严重受损材料时更具通用性的工具。
- 最先进的性能:Aeneas 在修复受损文本以及预测其书写时间和地点方面树立了新的最先进基准。

Aeneas 的工作原理
Aeneas 是一种多模态生成式神经网络,以铭文文本和图像作为输入。为了训练 Aeneas,我们整理了一个规模庞大且可靠的数据集,借鉴了历史学家数十年来创建数字馆藏的成果,尤其是 Epigraphic Database Roma (EDR)、Epigraphic Database Heidelberg (EDH) 和 Epigraphic Database Clauss Slaby (EDCS-ELT)。
我们对这些记录进行了清理、协调并链接,整合成一个单一的机器可操作数据集,称为 Latin Epigraphic Dataset (LED),其中包含来自古罗马世界各地的超过176,000条拉丁铭文。
我们的模型使用基于 Transformer 的解码器来处理铭文的文本输入。专门的网络利用文本进行字符复原和年代测定,而地理归属还将铭文图像作为输入。解码器从 LED 中检索相似铭文,并按相关性排序。
对于每一条铭文,Aeneas 的语境化机制会使用一种称为“嵌入”(embeddings)的技术检索一组平行文本——将每条铭文的文本和语境信息编码成一种历史指纹,其中包含文本内容、语言、来源时间和地点,以及它与其他铭文之间关系的细节。
最先进的性能
如下方可视化所示,与同样接受过拉丁语训练的其他通用模型相比,Aeneas 能更清晰地按书写日期对铭文进行分组。
Aeneas 在最多十个字符的缺损处修复受损铭文时,Top-20 准确率达到 73%。当修复长度未知时,这一准确率仅降至 58%——这本身就是一项极具挑战性的任务。它还以可解释的方式展示其推理过程,提供显著性图,以突出输入中哪些部分影响了其预测。得益于对视觉数据的使用,我们的模型能够以 72% 的准确率将一段铭文归属于 62 个古罗马行省之一。对于年代测定,Aeneas 能将文本定位在历史学家给出的日期范围内,误差在 13 年以内。
关于历史争论的新视角
为了测试 Aeneas 在一项持续研究争论中的能力,我们向它提供了最著名的罗马铭文之一:Res Gestae Divi Augusti,即皇帝 Augustus 以第一人称叙述其功绩的记述。
长期以来,历史学家一直围绕这篇铭文的年代判定展开争论。Aeneas 并未预测一个单一的固定日期,而是给出了可能日期的详细分布,显示出两个不同的峰值:一个较小的峰值位于公元前 10 年至公元前 1 年左右,另一个更大、置信度更高的峰值位于公元 10 年至 20 年之间。这些结果以量化方式捕捉到了两种主流年代判定假说。
Aeneas 的预测基于细微的语言特征和历史标记,例如文本中提到的官方头衔和纪念建筑。通过将年代判定问题转化为基于语言和语境数据的概率估计,我们的模型提供了一种新的、量化的方式,用以参与长期存在的历史争论。
最重要的是,Aeneas 还从与 Augustus 遗产相关的帝国法律文本中检索出了许多相关的相似文本,突显出帝国意识形态如何在不同媒介和地域中被复制。
协作推进历史研究
为了评估 Aeneas 作为研究辅助工具的影响,我们开展了一项大规模的历史学家与 AI 协作研究。我们邀请了二十三位经常处理铭文的历史学家,使用 Aeneas 对一组文本进行复原、断代和定位。
我们在下表中总结的评估结果显示,当历史学家结合使用 Aeneas 的上下文信息及其预测结果来复原和归属罗马铭文时,取得了最有效的结果。
Aeneas 帮助我们研究中的历史学家识别新的相似文本,并在他们处理复杂铭文学任务时增强了信心。历史学家一致强调,Aeneas 在加快其工作速度以及扩大最相关相似铭文范围方面具有价值。
Aeneas 的相似文本彻底改变了我对这篇铭文的看法。它注意到了一些细节,而这些细节对复原文本并确定其年代归属至关重要。
共享工具,塑造未来
Aeneas 旨在融入历史学家现有的研究工作流程。通过将专家知识与机器学习相结合,它开启了一种协作流程,提供可解释的建议,作为历史探究的宝贵起点。
作为今天发布的一部分,我们正在升级古希腊语模型 Ithaca,使其由 Aeneas 驱动,并纳入语境化功能、未知长度文本的修复以及整体性能提升。
我们还共同设计了一套新的教学大纲,用于在课堂中衔接技术技能与历史思维。该教学大纲与多项 AI 素养倡议保持一致,包括 European Commission 的 Digital Competences Framework for Citizens (DigComp 2.2)、UNESCO 的 AI Competency Framework for Students,以及 European Commission 与 Organization for Economic Cooperation and Development (OECD) 的 AILit Framework 预览版。
Aeneas 团队将继续与不同领域的主题专家合作,利用 Aeneas 帮助揭示我们的古代历史——未来还会有更多进展。
了解更多关于 Aeneas 的信息
致谢
该研究由 Yannis Assael 和 Thea Sommerschield 共同领导。
贡献者包括:Alison Cooley、Brendan Shillingford、John Pavlopoulos、Priyanka Suresh、Bailey Herms、Jonathan Prag、Alex Mullen 和 Shakir Mohamed。Aeneas 网页界面由 Justin Grayston、Benjamin Maynard 和 Nicholas Dietrich 开发,并由 Google Cloud 提供支持。
该教学大纲由比利时根特 Sint-Lievenscollege 的 Robbe Wulgaert 开发。