中文内容
AI 如何推动生物声学科学发展以拯救濒危物种
Perch 团队
科学家保护地球野生生态系统健康的方式之一,是使用麦克风(或水下水听器)收集海量音频,其中密集包含鸟类、青蛙、昆虫、鲸类、鱼类等动物的发声。这些录音可以告诉我们某一地区有哪些动物存在,并提供有关该生态系统健康状况的其他线索。然而,理解如此庞大的数据仍是一项艰巨任务。
今天,我们发布了 Perch 的更新版本,这是一款旨在帮助保护工作者分析生物声学数据的 AI 模型。与上一代模型相比,新模型在开箱即用的鸟类物种预测方面达到了更好的先进水平。它能更好地适应新环境,尤其是珊瑚礁等水下环境。它使用了范围更广的动物数据进行训练,包括哺乳动物、两栖动物以及人为噪声;总体数据量几乎翻倍,来源包括 Xeno-Canto 和 iNaturalist 等公开资源。它能够从数千甚至数百万小时的音频数据中解析复杂的声学场景。它也具有多用途能力,可帮助回答多种不同问题,从“有多少幼崽正在出生”到“某一地区有多少个体动物存在”。
为了帮助科学家保护地球生态系统,我们将这一新版 Perch 作为开放模型发布,并在 Kaggle 上提供。
成功案例:实地应用中的 Perch
自 2023 年首次发布以来,Perch 的初始版本已被下载超过 25 万次,其开放可用的解决方案如今已很好地集成到实地生物学家的工具中。例如,Perch 的向量搜索库现已成为 Cornell 广泛使用的 BirdNet Analyzer 的一部分。
此外,Perch 正在帮助 BirdLife Australia 和 Australian Acoustic Observatory 为多种独特的澳大利亚物种构建分类器。例如,我们的工具促成了对行踪隐秘的 Plains Wanderer 一个新种群的发现。
这是一项令人难以置信的发现——这样的声学监测将有助于塑造许多濒危鸟类物种的未来。
近期研究还发现,早期版本的 Perch 可用于识别单只鸟类并追踪鸟类丰度,从而有可能减少用于监测种群的捕捉—释放研究需求。
最后,University of Hawaiʻi 的 LOHE Bioacoustics Lab 的生物学家已使用它来监测和保护旋蜜雀种群。旋蜜雀在夏威夷神话中具有重要意义,并面临由非本地蚊子传播的禽疟疾所带来的灭绝威胁。Perch 帮助 LOHE Lab 发现旋蜜雀声音的速度比其常规方法快近 50 倍,使他们能够在更大区域监测更多旋蜜雀物种。我们预计新模型将进一步加速这些工作。
解开地球的播放列表
Perch 模型可以预测录音中出现了哪些物种,但这只是故事的一部分:我们还提供工具,使科学家能够从单个样本出发快速构建新的分类器,并监测训练数据稀缺的物种,或幼鸟叫声等非常特定的声音。给定一个声音样本后,使用 Perch 进行向量搜索即可在数据集中找出最相似的声音。随后,本地专家可以将搜索结果标记为相关或不相关,以训练分类器。
这种将向量搜索、主动学习与强大的嵌入模型相结合的方法,被称为敏捷建模。我们近期的论文《The Search for Squawk: Agile Modeling in Bioacoustics》表明,该方法适用于鸟类和珊瑚礁,并能在不到一小时内创建高质量分类器。
展望未来:生物声学的未来
我们的模型和方法正在共同帮助最大化保护工作的影响力,为有意义的实地工作留下更多时间和资源。从夏威夷的森林到海洋的礁石,Perch 项目展示了当我们将技术专长应用于世界最紧迫挑战时所能产生的深远影响。每构建一个分类器、每分析一小时数据,我们都离这样一个世界更近一步:地球的声音图景充满丰富而繁盛的生物多样性。
致谢
本研究由 Perch 团队开发:Bart van Merriënboer、Jenny Hamer、Vincent Dumoulin、Lauren Harrell、Tom Denton,以及来自 Google Research 的 Otilia Stretcu。我们还感谢 University of Hawaiʻi 的合作者 Amanda Navine 和 Pat Hart,以及 Cornell Lab of Ornithology 的 Holger Klinck、Stefan Kahl 和 BirdNet 团队。也感谢所有朋友和合作者——如果这篇博客文章还能多一千字,我们本会写到他们。