元鉴
返回中文阅读流

Kubernetes Blog

宣布成立 AI Gateway 工作组

Kubernetes 社区宣布成立 AI Gateway 工作组,致力于为支持 Kubernetes 中 AI 工作负载的网络基础设施制定标准与最佳实践。

中文内容

已翻译official company source英文原文2026-03-09

宣布成立 AI Gateway 工作组

By Keith Mattix, Nir Rozenbaum, Morgan Foster, Flynn | Monday, March 09, 2026

Kubernetes 社区包括多个特别兴趣小组(SIG)和工作组(WG),促进有兴趣的贡献者围绕重要主题开展讨论。今天,我们很高兴宣布成立 AI Gateway 工作组,这是一项新举措,重点是为支持 Kubernetes 环境中 AI 工作负载的网络基础设施制定标准和最佳实践。

什么是 AI Gateway?

在 Kubernetes 语境中,AI Gateway 指网络网关基础设施(包括代理服务器、负载均衡器等),通常实现 Gateway API 规范,并为 AI 工作负载提供增强能力。AI Gateway 并不是定义一个独立的产品类别,而是描述旨在对 AI 流量执行策略的基础设施,包括:

  • 针对 AI API 的基于 token 的速率限制。
  • 针对推理 API 的细粒度访问控制。
  • 通过载荷检查实现智能路由、缓存和防护栏。
  • 支持 AI 特定协议和路由模式。

工作组章程与使命

AI Gateway 工作组依据明确的章程运行,其使命是为 Kubernetes 特别兴趣小组(SIG)及其子项目制定提案。其主要目标包括:

  • 标准制定:为 Kubernetes 中的 AI 工作负载网络创建声明式 API、标准和指南。
  • 社区协作:促进围绕 AI 基础设施最佳实践的讨论并形成共识。
  • 可扩展架构:确保 AI 特定网关扩展具备可组合性、可插拔性和有序处理能力。
  • 基于标准的方法:建立在成熟网络基础之上,在经过验证的标准之上叠加 AI 特定能力。

活跃提案

WG AI Gateway 目前有多个活跃提案,旨在解决 AI 工作负载网络中的关键挑战:

载荷处理提案关注 AI 工作负载检查和转换完整 HTTP 请求与响应载荷的关键需求。这使以下能力成为可能:

AI 推理安全

  • 防范恶意提示词和提示词注入攻击。
  • 对 AI 响应进行内容过滤。
  • 对 AI 流量进行基于签名的检测和异常检测。

AI 推理优化

  • 基于请求内容的语义路由。
  • 通过智能缓存降低推理成本并提升响应时间。
  • 集成 RAG(检索增强生成)系统以增强上下文。

该提案定义了声明式载荷处理器配置、有序处理流水线和可配置失败模式的标准——这些都是生产级 AI 工作负载部署所必需的。

出站网关

现代 AI 应用越来越依赖外部推理服务,无论是用于专用模型、故障切换场景,还是成本优化。出站网关提案旨在定义安全地将流量路由到集群外部的标准。关键功能包括:

外部 AI 服务集成

  • 安全访问基于云的 AI 服务(OpenAI、Vertex AI、Bedrock 等)。
  • 为第三方 AI API 提供托管身份验证和 token 注入。
  • 区域合规与故障切换能力。

高级流量管理

  • 面向外部 FQDN 和服务的后端资源定义。
  • TLS 策略管理和证书颁发机构控制。
  • 面向集中式 AI 基础设施的跨集群路由。

我们正在解决的用户故事

  • 平台运营者向外部 AI 服务提供托管访问。
  • 开发者需要跨多个云提供商实现推理故障切换。
  • 合规工程师对 AI 流量执行区域限制。
  • 组织将 AI 工作负载集中到专用集群上。

即将举行的活动

KubeCon + CloudNativeCon Europe 2026,阿姆斯特丹

AI Gateway 工作组成员将在阿姆斯特丹的 KubeCon + CloudNativeCon Europe 上进行分享,讨论 AI 与网络交叉领域的问题,包括工作组的活跃提案,以及 AI Gateway 与 Model Context Protocol(MCP)和智能体网络模式的交汇。本场会议将展示 AI Gateway 工作组提案如何支持下一代 AI 部署和通信模式所需的基础设施。会议还将介绍初始设计、早期原型,以及正在形成并影响 WG 路线图的新方向。更多详情请参见我们的会议:

  • 我在门口!介绍 Kubernetes 中的 AI Gateway 工作组

参与进来

AI Gateway 工作组代表了 Kubernetes 社区对标准化 AI 工作负载网络的承诺。随着 AI 日益成为现代应用的重要组成部分,我们需要稳健、标准化的基础设施,既能支持推理工作负载的独特需求,又能保持 Kubernetes 用户所期望的安全性、可观测性和可靠性标准。我们的提案目前正在积极开发中,各类网关项目也已开始实现。我们正与 SIG Network 密切合作,推进 Gateway API 增强,并与更广泛的云原生社区协作,确保我们的标准满足真实生产环境需求。

无论你是网关实现者、平台运营者、AI 应用开发者,还是只是对 Kubernetes 与 AI 的交叉领域感兴趣,我们都欢迎你的意见。该工作组遵循开放贡献模式——你可以审阅我们的提案,参加每周会议,或在我们的 GitHub 仓库中发起讨论。了解更多:

  • 访问该工作组的总括 GitHub 仓库。
  • 阅读该工作组章程。
  • 参加每周四美国东部时间下午 2 点的周会。
  • 在 Slack(#wg-ai-gateway)上联系该工作组(访问 https://slack.k8s.io/ 获取邀请)。
  • 加入 AI Gateway 邮件列表。

Kubernetes 中 AI 基础设施的未来正在今天构建;加入我们,了解你如何贡献并帮助塑造 Kubernetes 中具备 AI 感知能力的网关功能的未来。

  • ← 上一篇
Last modified March 06, 2026 at 1:30 PM PST: target date (a425e993b0)

原文标题

Announcing the AI Gateway Working Group