中文内容

已翻译official company source英文原文2026-05-19

Back to Articles

OlmoEarth v1.1：更高效的地球观测模型家族

团队文章发布于 2026 年 5 月 19 日

Upvote

正文：22

正文：+16

通过缩短序列长度提升效率设计 token 面向开发者面向研究者开始使用 🧠 模型：https://huggingface.co/collections/allenai/olmoearth | 📄 技术报告：https://allenai.org/papers/olmoearth_v1_1 | 💻 代码：https://github.com/allenai/olmoearth_pretrain

我们于 2025 年 11 月发布了 OlmoEarth（v1）。此后，合作伙伴已将其应用于广泛任务，从追踪红树林变化、分类森林损失驱动因素，到在数天内生成国家尺度的作物类型地图，并将部署扩展到国家、大洲和全球范围。每一次发布都让我们更接近使命：把最先进的 AI 带给致力于保护人类和地球的组织与社区。

当 OlmoEarth 处理卫星影像，在数万至数十万平方公里范围内进行预测时，效率决定了可能实现的边界。在运行 OlmoEarth 的完整生命周期中——数据导出、预处理、推理和后处理——计算远远是最高成本。更高效的模型意味着我们可以在 OlmoEarth Platform 上支持更多合作伙伴，也意味着任何自行运行 OlmoEarth 的用户都能更快、以更低成本利用这项技术。

这就是我们构建 OlmoEarth v1.1 的原因：这是一个新的模型家族，在我们与合作伙伴构建的一组研究基准和任务上保持 OlmoEarth v1 性能的同时，将计算成本最高降低 3 倍。

通过缩短序列长度提升效率

OlmoEarth 模型是基于 transformer 的模型，这是当今机器学习中的主流架构之一。为了处理遥感数据，我们首先将其转换为模型可摄取的 token 序列。

在基于 transformer 的模型中，有两个重要杠杆控制效率：模型规模（这也是我们发布一个模型家族的原因，使用户可以选择符合其计算预算的规模）和 token 序列长度。计算成本随 token 序列长度呈二次方增长，因此即使小幅缩短，也能显著降低运行模型的成本。

MACs，即乘加运算，用于估算一次模型前向传播所需的计算量；较低的 MACs 通常意味着更便宜、更快速的推理。y 轴被反转，因为较低的平均排名更好。标签显示模型家族和规模。所有绘制点都使用粘贴的 MAC/rank 数值。

设计 token

这引出了基于 transformer 的遥感模型中的一个重要问题：token 应该代表什么？

以 Sentinel-2 影像为例，这是我们处理的一种常见模态。一个 Sentinel-2 输入会是某个具有高度和宽度的张量（H、W 表示纬向和经向像素）、一个时间维度 T，以及 12 个 Sentinel-2 通道（[H, W, T, D=12]）。

目前，我们按分辨率将数据拆分为 patch。具体而言，这意味着我们会选择某个空间 patch 大小 p，并将整体 Sentinel-2 图像拆分为 p x p 大小的 patch：

对于每个 patch，我们按每个时间步、每种分辨率创建一个 token。因此，带有 2 个时间步的 Sentinel-2 输入，每个 patch 会产生 6 个 token（2 个时间步 x 3 种分辨率：10m、20m 和 60m）。

总计，一个 [H, W, T, D=12] 的 Sentinel-2 输入会产生 H/p x W/p x T x 3 个 token。

在处理 Sentinel-2 数据时，为每种分辨率使用唯一 token 是一种常见技术——Galileo 和 SatMAE 都采用这种方法，而 SatMAE 显示这样做会取得显著更好的结果。不过，这并非通用做法：CROMA 是一种无论分辨率如何都只为所有波段使用单一 token 的模型。由于 token 数量以乘法方式叠加，将多种分辨率合并为单一 token 会使 token 数量减少三倍，并在预训练、微调和推理过程中带来显著节省。

以这种方式简单合并 token 会导致性能显著下降，包括在 m-eurosat kNN（遥感模型的常见基准任务）上下降 10 个百分点。我们推测，将 Sentinel-2 波段分离到不同 token 中，使 OlmoEarth 更容易建模重要的跨波段关系。

在不影响性能的情况下合并 token，需要我们修改预训练流程。我们在论文中详细描述了这些变化。

面向开发者

结果是一个以更少资源完成更多工作的模型家族。在每一种规模上，OlmoEarth v1.1 的运行成本都比 OlmoEarth v1 最高低三倍，使每个运行 OlmoEarth 的团队都能更负担得起频繁的行星尺度地图刷新。如果你正在使用原始 OlmoEarth 家族中的模型，可以尝试 OlmoEarth v1.1。它在只需三分之一计算量的情况下提供与 OlmoEarth v1 相近的性能，不过我们也观察到了一些回退（更多详情见技术报告）。如果它适用于你的任务，你应该会在微调和推理过程中看到显著加速。

面向研究者

预训练遥感模型有许多自由度，因此很难研究。当性能发生变化时，原因是架构、数据集，还是预训练算法？

我们使用与 OlmoEarth v1 相同的数据集训练 OlmoEarth v1.1，因此两者之间的任何差异都能隔离出方法变化的影响。我们希望这能推进对遥感模型预训练科学原则的理解。

开始使用

查看 OlmoEarth v1.1 权重和训练代码，包括我们的 Base、Tiny 和 Nano 模型权重。

本文提到的合集 1

正文：OlmoEarth

合集

用于遥感的 OlmoEarth 预训练和微调基础模型 • 14 项 • 21 天前更新 • 29

该作者的更多内容

EMO：为涌现模块化进行混合专家预训练

正文：38

2026 年 5 月 8 日

社区

tomaarsen

16 days ago

这真的非常非常酷！

编辑预览

Upload images, audio, and videos by dragging in the text input, pasting, or 点击这里.

点击或粘贴到这里以上传图片

Comment

· 注册或登录以评论

Upvote

正文：22

正文：+10

本文提到的合集 1

正文：OlmoEarth

合集

用于遥感的 OlmoEarth 预训练和微调基础模型 • 14 项 • 21 天前更新 • 29

OlmoEarth v1.1：更高效的地球观测模型家族

中文内容

OlmoEarth v1.1：更高效的地球观测模型家族

通过缩短序列长度提升效率

设计 token

面向开发者

面向研究者

开始使用

本文提到的合集 1

正文：OlmoEarth

EMO：为涌现模块化进行混合专家预训练

社区

本文提到的合集 1

正文：OlmoEarth

原文标题