中文内容
每年,Azure Cosmos DB Conf 都为我们提供了一个窗口,让我们了解现代应用程序是如何构建的——不是停留在理论层面,而是在全球规模的生产环境中。
今年,Cosmos Conf 的关键主题非常明确:AI 不只是另一种工作负载。它正在从根本上重塑应用程序以及数据平台的构建方式。
在开场主题演讲中,Azure Cosmos DB 副总裁 Kirill Gavrylyuk 描述了推动这一转型的三个关键转变,而我们在活动中的每一个客户故事里都看到了这些转变的体现。
正在通过 Azure Cosmos DB 重塑应用架构的三大 AI 转变
AI 正在使灵活的半结构化数据成为基础
AI 应用并不基于僵化的架构运行。它们基于提示词、记忆和上下文运行,而这些本质上都是半结构化的,并且会随着时间不断演变。
这从根本上改变了数据库必须具备的行为方式。
数据平台不再只是记录系统——它们正在成为推理系统,而灵活性对于应用程序如何学习、适应并生成结果至关重要。
AI 正在显著加快开发速度
AI,尤其是编码智能体,正在改变软件的构建方式。
开发者正在:
- 更快地迭代
- 更频繁地发布
- 从零瞬间扩展到大规模使用
正如 Kirill 所强调的,开发者不能再受严格模式的约束。灵活性不仅仅是一种便利——它使团队能够以 AI 的速度前进。数据库需要通过 serverless 形态、即时且无限的可扩展性、先进的集成缓存来满足需求,并提供对智能体友好的接口。
语义搜索正在成为一等查询操作符
第三个转变同样重要:
AI 应用需要:
- 向量搜索
- 全文搜索
- 混合搜索
- 语义排序
这些不再是“附加功能”。它们是现代应用程序运行方式的核心。
在 Cosmos DB Conf 上,我们看到了一个清晰的模式:各团队正在构建将检索、推理和实时上下文紧密集成的应用程序。
OpenAI:行星级规模的灵活性
这些转变在 OpenAI 等组织正在构建的内容中体现得最为明显。
在 Cosmos Conf 上发言时,OpenAI 的 Jon Lee 谈到了他们如何以超大规模运营——处理数万亿笔事务和数 PB 数据——这进一步表明,最重要的不仅是规模,还有快速演进的能力。
正如 Jon 所分享的,现代系统必须能够:
- 从零使用量瞬时扩展到大规模使用量。
- 支持无模式设计,以实现快速接入。
- 使数千名开发者能够同时迭代。
“最重要的事情……是能够从零扩展到数百万 QPS,能够从零字节扩展到 PB 级数据,”Jon 解释道,并补充说速度和灵活性是相辅相成的。
我们有数千名开发者正在积极构建产品……让他们能够非常快速地接入数据库真的很重要。
这正是 Kirill 所描述的世界:AI 系统需要灵活的数据模型,并且这些模型要能像应用本身一样快速演进。
这凸显了 Azure Cosmos DB 如何支持动态演进的大规模 AI 工作负载。
Vercel:Serverless、AI 原生应用的兴起
如果说 OpenAI 展示了规模化所能实现的可能性,那么 Vercel 则展示了应用形态正在如何变化。
正如 Vercel CEO Guillermo Rauch 所解释的那样,AI 正在显著扩大能够构建软件的人群范围——从数百万开发者扩展到潜在的数十亿创作者,其中许多人正在使用智能体按需生成应用。Kirill 在他的主题演讲中强调了这一点,他表示,超过一半的 Azure Cosmos DB 客户已经在其开发工作流中使用编码智能体。
据 Guillermo 所说,这正在推动一种结构性转变,转向:
- 无服务器架构
- 短暂型应用程序
- 从零到爆红的即时扩展
数据平台必须跟上这一节奏。为支持这种速度,平台需要提供:
- 内置最佳实践(数据建模、分区和优化)。
- 智能指导(代理技能和自动化)。
- 关于性能和成本的实时反馈。
在谈到为什么转向 Azure Cosmos DB 时,Guillermo 表示:“我想要一个能提供经济性思维的系统,让开发者编写查询时能够了解其成本。”
开发人员需要立即了解其决策所带来的成本影响,从而使效率成为内置的设计原则,而不是事后才考虑的问题。
这反映出一个更广泛的转变:AI 原生应用正构建在 Azure Cosmos DB 等全球分布式、无服务器数据平台之上。
Walmart:大规模可靠性与性能
尽管 AI 正在改变应用程序的构建方式,但有一点并未改变:性能和可靠性仍然是任务关键型要素。
正如 Kirill 所强调的,AI 并不会消除对可靠性、安全性和性能的需求。
事实上,它提高了标准。在 Walmart 等会议环节中,这一点得到了强化;其中技术研究员 Sid Anand 解释说,大规模应用必须:
- 在全球范围内提供低延迟体验。
- 在区域性故障期间保持可用。
- 在超大规模下保持一致的性能。
“我们希望无论某个云区域发生什么情况,人们都能够将商品加入购物车并查看购物车……而且我们需要所有这些交互都保持低延迟,因为任何形式的延迟阻碍都会导致用户流失,”Sid 说。
从 GB 到 PB,从数百笔到数万亿笔交易,现代系统必须在不可预测的需求下无缝运行。
这些要求与 Azure Cosmos DB 面向全球分布和大规模低延迟的设计方式相一致。
成本效率成为核心设计原则
Cosmos Conf 的最后一个要点是:随着系统变得更加复杂,成本变得与规模同样重要。
在主题演讲和各场会议中,我们看到了一个明显的转变:
- 开发者需要实时的成本可见性。
- 架构师需要从一开始就以效率为目标进行设计。
- 团队希望整合平台并降低复杂性。
这正是 Azure DocumentDB 等创新进入关注焦点的地方。
正如主题演讲中强调的,Azure DocumentDB 与替代方案相比成本降低超过 40%,并通过简化架构实现高性能。它还支持开源、多云可移植性场景。其结果是为构建者提供了更广泛的选择:
- Azure Cosmos DB → 面向全球规模、无服务器和五个九的可靠性。
- Azure DocumentDB → 面向成本效率、灵活性和开放生态系统。
开发者现在就可以开始构建的设计和架构示例
除了主题演讲之外,Cosmos Conf 上还有多场以演示为驱动的会议,涵盖应用架构、可复用模式,以及构建和扩展 AI 赋能解决方案的最佳实践。
例如,初创公司 SmartServe 的首席机器工程师 Farah Abdou 分享了她的团队如何使用 Azure Cosmos DB 作为统一的“代理记忆结构”来重建其架构。通过结合用于语义缓存的向量搜索、用于事件驱动协调的变更源,以及用于防止冲突的乐观并发控制,他们得以降低成本,实现低于 100 毫秒的代理交接,并消除状态冲突。
另一个我们经常被问到的话题是,用户如何保护和治理他们的 AI 应用。Microsoft 首席云倡导者 Pamela Fox 讲解了如何使用模型上下文协议(MCP)构建安全的多用户 AI 系统。通过使用 Entra ID 对用户进行身份验证,并将每个用户的数据存储在 Azure Cosmos DB 中,她实现了基于角色的访问控制与 Microsoft Graph,以及使用 VS Code 和 GitHub Copilot 等工具的实用开发工作流。
从这些动手实践模式到大规模生产系统,其经验始终一致:团队从第一天起就在为规模化、效率和真实世界使用而设计。
关键要点
- AI 应用需要灵活且不依赖模式的数据模型。
- 无服务器和即时可扩展性正成为默认预期。
- 语义搜索和向量搜索如今已成为应用设计的核心。
- 必须从一开始就设计成本可见性和效率。
为未来而构建
我们正在进入应用程序开发的新时代。应用程序正变得以 AI 为原生、全球分布,并且持续演进。
而成功将取决于组织在多大程度上适应这些变化。
我们在 Cosmos Conf 上听到的最具前瞻性的团队已经在通过以下方式做到这一点:
- 为灵活性而设计。
- 为速度而构建,而不仅仅是规模。
- 将成本和性能视为关键考量。
- 不仅在应用中利用 AI,也在应用构建方式中利用 AI。
这不仅仅是一次技术转变。
这是我们思考如何构建软件的方式的转变。
按需观看 Cosmos DB Conf
如果你错过了 Cosmos Conf 2026,可以按需浏览所有会议内容,并直接听取如今正在生产环境中构建这些系统的团队的分享。
今年分享的模式不仅仅是最佳实践,更是未来发展的蓝图。






