元鉴
返回中文阅读流

Google DeepMind Blog

Gemini 在国际大学生程序设计竞赛世界总决赛中达到金牌水平

Gemini 2.5 Deep Think 在全球最负盛名的编程竞赛中取得突破性表现,展示了抽象问题解决能力的巨大飞跃。

中文内容

已翻译official company source英文原文2025-10-24
2025年9月17日研究

Gemini 在国际大学生程序设计竞赛全球总决赛中达到金牌水平

正文:Hanzhao (Maggie) Lin, Heng-Tze Cheng

Gemini achieves gold-medal level at the International Collegiate Programming Contest World Finals-hero

Gemini 2.5 Deep Think 的高级版本在 2025 年国际大学生程序设计竞赛(ICPC)全球总决赛中达到了金牌水平的表现。

这一里程碑直接建立在 Gemini 2.5 Deep Think 两个月前在国际数学奥林匹克(IMO)中获得金牌的基础之上。这些努力所带来的创新将继续整合到未来版本的 Gemini Deep Think 中,拓展学生和研究人员可获取的先进 AI 能力前沿。

在这些竞赛中解决复杂任务需要深度抽象推理、创造力、综合形成前所未见问题的新颖解决方案的能力,以及真正的巧思火花。

这些在竞技编程和数学推理方面的突破共同展示了 Gemini 在抽象问题求解上的深刻跃升——标志着我们迈向通用人工智能(AGI)道路上的重要一步。

ICPC 树立了卓越的全球标准

ICPC 被全球公认为历史最悠久、规模最大、最负盛名的大学级算法编程竞赛。这比 IMO 等高中级奥林匹克竞赛更进一步。每年,来自近 3000 所大学、超过 103 个国家的参赛者竞争解决现实世界中的编码问题。

今年的世界总决赛于 9 月 4 日在阿塞拜疆巴库举行,汇集了来自此前比赛阶段的顶尖队伍。在五个小时内,每支队伍都要应对一组复杂的算法问题。最终排名取决于两条严苛原则:只有完美解法才能得分,而且每一分钟都至关重要。在 139 支参赛队伍中,只有排名前四的队伍获得了金牌。

Gemini 解决了 12 道题中的 10 道,达到金牌水平

一个高级版本的 Gemini 2.5 Deep Think 在竞赛组织者的指导下,按照 ICPC 规则在远程在线环境中进行了实时参赛。它比人类参赛者晚开始 10 分钟,并正确解答了 12 道题中的 10 道,在同样的五小时时限内达到了金牌级表现。请在此查看我们的解答。

Gemini 在短短 45 分钟内解答了 8 道题,并在 3 小时内又解答了 2 道题,使用了多种高级数据结构和算法来生成其解答。Gemini 2.5 Deep Think 解答 10 道题的总用时为 677 分钟;如果与竞赛中的大学队伍相比,它的总体排名将位列第 2。

ICPC 全球执行主任 Bill Poucher 博士表示:“ICPC 始终致力于树立问题解决领域的最高标准。Gemini 成功加入这一竞技场,并取得金牌级成绩,标志着在定义下一代所需的 AI 工具和学术标准方面的一个关键时刻。祝贺 Google DeepMind;这项工作将帮助我们推动一场造福所有人的数字复兴。”

柱状图显示了 2025 年 ICPC World Finals 中解答 12 道题各自所用的时间。Gemini 的用时以蓝色显示,最快大学队伍的用时以灰色显示。

Gemini 解决了一道没有任何大学团队解决的问题

在一个前所未有的时刻,我们的模型在前半小时内成功且高效地解决了 Problem C——而竞赛中没有任何大学团队解决这道题。

Problem C 要求为通过相互连接的管道网络向一组蓄水池分配液体寻找一种方案,目标是找到这些管道的一种配置,使所有蓄水池尽可能快地被填满。可能的配置有无限多种,因为每条管道都可以是打开、关闭,甚至是部分打开,这使得搜索最优配置变得非常困难。

Gemini 通过一个巧妙的洞察找到了有效解法:它首先假设每个蓄水池都有一个“优先级值”,表示相较于其他蓄水池,每个蓄水池应被优先照顾的程度。给定一组优先级值时,可以使用动态规划算法找到管道的最佳配置。Gemini 发现,通过应用 minimax theorem,原始问题可以转化为寻找使所得流量受限程度最大的优先级值。利用优先级值与最优流之间的关系,Gemini 使用嵌套三分搜索在碗状的凸解空间中快速找到最优优先级值,并解决了 Problem C。

Gemini 的性能汇聚了一系列进展

我们的里程碑式性能汇聚了预训练、后训练、新型强化学习技术、多步推理和并行思考方面的一系列进展。这些创新帮助 Gemini 探索解决复杂问题的不同方式,验证解决方案,并在回应前持续迭代。

例如,在强化学习过程中,我们训练 Gemini 针对程序员面临的一些最困难问题进行推理并生成代码,从结果反馈中学习并改进其方法。为了解决一个问题,多个 Gemini 代理各自提出自己的解决方案,使用终端执行代码和测试,然后基于所有尝试迭代这些解决方案。

我们的内部研究显示,Gemini 2.5 Deep Think 的一个类似版本也能在 2023 年和 2024 年 ICPC World Finals 中达到金牌水平表现,其表现可媲美全球前 20 名竞技程序员。

Gemini 成功加入这一竞技领域并取得金牌级成绩,标志着在界定下一代所需的 AI 工具和学术标准方面迎来了一个关键时刻。
Bill Poucher 博士,ICPC 全球执行主任

探索 Gemini 作为协作伙伴的潜力

在 ICPC 达到金牌级水平,对软件开发具有直接而实际的影响,并表明 AI 能够成为程序员真正的问题解决伙伴。如果将比赛中最佳的 AI 解法与人类解法相结合,全部 12 道题都将被完整且正确地解决。这显示出 AI 有潜力提供独特而新颖的贡献,与人类专家的技能和知识形成互补。

除了数学和编程之外,我们的成果还展示了一种强大的抽象推理新能力。ICPC 所需的技能——理解复杂问题、制定多步骤的逻辑计划并完美实施——同样也是许多科学和工程领域所需的技能,例如设计新药或微芯片。这表明,AI 正在从单纯处理信息转向真正帮助解决世界上一些最困难的推理问题,并有可能以造福人类的方式做到这一点。

拥有 Google AI Ultra 订阅的 Gemini 用户已经可以在 Gemini 应用中使用 Gemini 2.5 Deep Think 的轻量版。在不久的将来,更智能的 AI 编程助手可能会帮助开发者应对日益复杂的工程挑战。从物流和调试到科学研究,通过将 AI 作为协作工具,一些最艰难、最难以解决的问题的解决方案或许很快就会触手可及。

我们感谢 International Collegiate Programming Contest(ICPC)的支持。

该项目是一项大规模协作,其成功归功于众多个人和团队的共同努力。Hanzhao (Maggie) Lin 领导了 Gemini 竞技编程和 ICPC 2025 工作的整体技术方向,并与 Heng-Tze Cheng 共同领导了整体研究和执行工作。

ICPC 2025 团队的负责人和主要贡献者如下:Chenkai Kuang、Yuan Liu、Zhaoqi Leng、Jieming Mao、Lalit Jain、Chenjie Gu、Goran Žužić、Adams Yu、YaGuang Li、Xiaomeng Yang、Yang Xiao、Adam Zhang、Alex Vitvitskyi、Ashkan Norouzi Fard、Blanca Huergo、Evan Liu、Golnaz Ghiasi、Huan Gui、John Aslanides、Jonathan Lee、Kuba Lacki、Larisa Markeeva、Luheng He、Nigamaa Nayakanti、Nikos Parotsidis、Paul Covington、Petar Veličković、Qijun Tan、Ragha Kotikalapudi、Renshen Wang、Sasan Tavakkol、Shuang Liu、Sidharth Mudgal、Steve Li、Vincent Cohen-Addad、Xianghong Luo、Xinying Song、Yiming Li 和 Zicheng Xu。

用于 ICPC 的高级 Gemini Deep Think 建立在来自 Gemini 后训练、Thinking 和 Coding 领域的基础研究之上,这些研究由以下人员共同完成:Aja Huang、Andreas Kirsch、Ankesh Anand、Archit Sharma、Betty Chan、Chenxi Liu、Cosmo Du、Dawsen Hwang、Dustin Tran、Edward Lockhart、Feryal Behbahani、Fred Zhang、Garrett Bingham、Hao Zhou、Hoang Nguyen、Irene Cai、Jian Li、Jarrod Kahn、Junehyuk Jung、Junsu Kim、Kate Baumli、Kefan Xiao、Le Hou、Lei Yu、Maciej Kula、Mahan Malihi、Marcelo Menegali、Miklós Z. Horváth、Mirek Olšák、Nate Kushman、Pei Sun、Pol Moreno、Rosemary Ke、Sahitya Potluri、Shane Gu、Shubha Raghvendra、Siamak Shakeri、Sid Lall、Steven Zheng、Thang Luong、Theophane Weber、Tong He、Tianhe (Kevin) Yu、Trieu Trinh、Vikas Yadav、Vinay Ramasesh、Vinh Tran、Weiyue Wang、Wilfried Bounsi、Xiyang Luo、Yangsibo Huang、Yi Tay、Yong Cheng、Yuan Zhang、Yuri Chervonyi 和 Yujing Zhang。

这项工作由 Quoc Le 和 Vahab Mirrokni 提供指导,并由 Kristen Chiafullo、Eric Ni、Srinivas Tadepalli、Jessica Lo 和 Sajjad Zafar 负责项目与运营管理。

我们还要感谢我们的竞技编程专家提供见解:Alexander Grushetsky、Chun-Sung Ferng、Ilya Kornakov、Liang Bai、Petr Mitrichev 和 Sergey Rogulenko。

我们向 Gemini 服务团队致以最深切的感谢:Abhijit Karmarkar、Cip Baetu、Emanuel Taropa、Evan Senter、Federico Lebron、Girish Ramchandra Rao、Greg Anielak、Hamish Tomlinson、Hayden Jeune、Jia Zhao、Joe Stanton、Ashish Shenoy、Jonathan Kairupan、Juliette Love、Justin Mao-Jones、Kashyap Krishnakumar、Ken Franko、Mahesh Palekar、Minh Giang、Nikhil Sethi、Rohan Jain、Rohit Varkey Thankachan、Soheil Hassas Yeganeh、Thomas Jimma 和 Vitor Rodrigues。

还要感谢以下人员提供支持、协作和建议:Benoit Schillings、Ed Chi、Koray Kavukcuoglu、Jeff Dean、Oriol Vinyals、Noam Shazeer、James Manyika、Yossi Matias、Philipp Schindler、Pushmeet Kohli、Demis Hassabis、Sergey Brin、Melvin Johnson、Omer Levy、Timothy Lillicrap、Anca Dragan、Slav Petrov、Ya Xu、Madhavi Sewak、Erika Gemzer、Eugénie Rives、Erica Moreira、Tulsee Doshi、Alex Goldin、Jane Labanowski、Andy Forbes、Sean Nakamoto、Yifeng Lu、Denny Zhou、Alexander Novikov、Cristy Hayner、Hanada Tatsuki、Harsh Dhand、Ritu Ghai、Hiroki Kayama、Jenny Rizk Nicholls、Jo Chick、Song Zuo、Pratyusha Mukherjee、Shibo Wang、Carlos Guia、Xiaofan Zhang、……

最后,我们感谢 ICPC global 的 Bill Poucher 博士的支持与认可。

ICPC 全球组织已确认,我们提交的解决方案完整并已被接受。需要注意的是,他们的审查并不包括验证我们的系统、流程或底层模型。

原文标题

Gemini achieves gold-medal level at the International Collegiate Programming Contest World Finals