点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能“迎战”奥数难题
首页> 科技频道> 综合新闻 > 正文

人工智能“迎战”奥数难题

来源:科技日报2024-08-05 10:11

  IMO中的问题涵盖了多个数学领域。但大多数IMO问题都是用英语编写的,需要翻译成AI能理解和验证的编程语言,才能让AI进行机器学习。

  图片来源:《自然》网站

  【今日视点】

  继击败人类围棋大师和战略棋盘游戏顶尖高手之后,谷歌“深度思维”公司人工智能(AI)系统在英国巴斯举行的2024年国际数学奥林匹克竞赛(IMO)上,仅以1分之差与金牌失之交臂,获得了银牌。这是AI选手首次登上IMO领奖台。

  英国《自然》杂志网站在7月27日的报道中指出,“深度思维”正与其他公司竞相解决数学领域的疑难问题。近年来,IMO被广泛认为是对机器学习的一个挑战,也是衡量AI系统高级数学推理能力的理想基准。AI系统在今年IMO中的精彩表现,标志着其即将再下一城:在解决数学难题方面击败世界顶尖学生。

  首登领奖台

  “深度思维”公司训练了一个专门用于解答数学奥赛考题的AI系统,成功解答了6道竞赛题中的4道,获得28分(满分42分),达到本次比赛银牌获得者的水平。

  该系统包括解答数学推理问题的模型AlphaProof和解答几何问题的模型AlphaGeometry的升级版AlphaGeometry 2。其中,AlphaGeometry 2解决了一个几何问题,而AlphaProof则解答了两个代数问题和一个数论问题。

  今年1月份,AlphaGeometry在解决欧几里得几何问题上,就已表现出奖牌级选手的水平。在今年的IMO比赛前,AlphaGeometry 2已经能够解决过去25年里83%的IMO几何问题,而其“前身”仅能解决53%。

  “深度思维”公司AI科学副总裁普什米特·科利指出,这是AI系统首次达到获IMO奖牌级别的性能。IMO主席格雷戈尔·多利纳尔也表示,AI最终将能比人类更好地解决大多数数学问题,其进步速度令人惊叹。

  几乎同一时间,软件公司Numina的科学家使用语言模型,赢得了AI数学奥林匹克奖(AIMO)的首个“进步奖”。

  但Numina团队在获奖后表示,要解决更难的数学问题,仅靠语言模型可能还不够。

  与自己对抗

  AlphaProof是一个自学习系统,其核心创新在于结合预训练语言模型与AlphaZero强化学习算法的策略。强化学习是机器学习领域一种重要的学习范式,系统可通过多次尝试找到自己的解题方法。

  这种方法需要用AI能理解和验证的语言编写大量问题,而大多数IMO问题都是用英语编写的。为解决这个问题,“深度思维”团队托马斯·赫伯特及其同事使用谷歌的大语言模型Gemini,将这些问题翻译成一种名为Lean的编程语言,以供AI进行学习。

  AlphaProof使用经过微调的Gemini模型,自动将数学问题转换为Lean语言,从而创建了一个涵盖不同难度级别的大型问题库。在强化学习阶段,系统每验证一个证明,就用它来强化AlphaProof的语言模型,提高其解决后续更具挑战性问题的能力。

  赫伯特表示,在挑战围棋游戏时,他们也采用了类似的方法:AI通过与自己对抗,来学习如何更好地玩游戏。结果显示,在某些情况下,AlphaProof能够在无限多的可能性中迈出正确的一步,展现出“灵光一闪”的能力。

  仍有改进空间

  尽管AlphaProof的表现令人印象深刻,但其速度相对较慢,解决3个问题耗费了3天时间,而人类参赛者仅需4个半小时。此外,它也未能回答两个与组合数学有关的问题。

  英国数学家约瑟夫·迈尔斯审查了AI在本次IMO比赛中给出的答案。他指出,AlphaProof采取的这些技术能否予以完善还有待观察。

  英国伦敦数学科学研究所何杨辉称,AlphaProof这样的系统对于帮助数学家证明问题很有用,但它无法帮助研究人员确定需要解决和研究的问题。

  “深度思维”团队表示,他们正继续探索多种用于推进数学推理的AI方法。未来,数学研究者将与AI合作验证假说,尝试新方法来解决长期未解决的数学难题。他们也希望AlphaProof能够通过减少错误响应,帮助改进谷歌的大型语言模型。(记者 刘 霞)

[ 责编:焦子原 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 福建泉金客运码头迎来清明节两岸人员往来高峰

  • “地球彩带”孕育火热“花经济”

独家策划

推荐阅读
征求意见稿提出,任何组织和个人提供、使用数字虚拟人服务,不得以丑化、污损等形式侵害他人人格权,未经特定自然人同意,不得提供足以识别特定自然人身份的数字虚拟人服务。
2026-04-03 17:59
近日,《关于加快建立长期护理保险制度的意见》(以下简称《意见》)印发。《意见》明确,用3年左右时间,基本建立适应我国基本国情的长期护理保险制度。
2026-04-03 10:07
春天,风媒花粉对过敏症患者尤其是患有慢性呼吸系统病人群的影响特别大,是过敏性哮喘的高发季节。
2026-04-03 10:04
个人信息保护法施行以来,中央网信办会同有关部门持续加大个人信息保护工作力度,查处各类违法违规处理个人信息行为,督促指导个人信息处理者不断提升合规水平,取得了积极成效。
2026-04-03 09:59
日前,福建龙岩长汀县远丰优质稻专业合作社正忙着把秧苗往田里送,并用机器进行插秧。一粒粒种子在智慧育秧工厂从孕育到出苗,直至送入农田进行机械化插秧,合作社负责人傅木清都看在眼里。
2026-04-03 09:53
据报道,在3月29日结束的世界超级摩托车锦标赛(WSBK)葡萄牙站WorldSSP组别中,我国摩托车制造商“张雪机车”在该站赛事双回合正赛中相继夺冠。说起“张雪机车”的成功,不得不提到中国的“摩托之都”重庆。
2026-04-03 09:50
在一间会议室里,记者找到了研究院副院长张金友。”  为了尽快解决这个“烧脑”的问题,这段时间,张金友和团队几乎每天井场、实验室、会议室三点一线。“如果说我们正在采的页岩油是已经蒸熟的‘米饭’,那低熟页岩油就是‘生米’,需要人工在地下为其加热,催化生成石油。
2026-04-03 09:47
历时多年攻关,刘河生带领团队不断改进脑功能区定位技术,实现快速精准绘制个体脑图,并研发出可无创干预脑区功能的设备,在帕金森等疾病治疗研究中取得重大进展。
2026-04-02 10:11
我国智能航运发展现状如何?“十五五”时期如何迈向国际先进水平?记者采访了交通运输部海事局及相关企业。
2026-04-02 10:07
科技创新是发展新质生产力的核心要素,加强原始创新和关键核心技术攻关,是抢占科技制高点、实现高水平科技自立自强的根本所在。
2026-04-02 10:04
近日,国家医保局发布《医疗保障基金使用监督管理条例实施细则》,于2026年4月1日起正式施行。
2026-04-02 10:03
国家卫健委和国家中医药局1日联合印发《关于开展基层医疗卫生机构医疗质量改善三年行动(2026—2028年)的通知》,推进基层医疗质量提升,推动实现分级诊疗“基层首诊”落地。
2026-04-02 10:01
人与自然和谐共生是中国式现代化的重要特征之一,守好碧海银滩,构建人海和谐的海洋生态环境是中国式现代化的题中应有之义。
2026-04-01 09:45
2021年长江十年禁渔实施以来,禁渔秩序总体平稳,退捕渔民生计有效保障,水生生物资源衰退趋势得到决定性扭转,长江水生生物完整性指数稳步提升,取得阶段性明显成效。
2026-04-01 09:44
“过去雷达网建设主要解决‘有没有’的问题,现在AI让这张网从‘能探测’升级为‘会思考’。”在张兴赢看来,“AI正在成为工程的‘第二大脑’。”
2026-04-01 09:43
硒是人体必需的微量矿质营养素。然而,我国约7亿人口存在硒摄入不足。
2026-04-01 09:42
强对流天气的形成是水汽条件、不稳定状态的大气层结构、地形等多种条件协同作用的结果,包括雷暴、短时强降水、大风、冰雹等天气现象,具有影响快、强度强、致灾性强的特点。
2026-04-01 09:39
3月30日,世界数据组织正式成立并落户北京,理事长由中国科学院院士谭铁牛担任。这不仅是对谭铁牛个人学术成就的认可,更是国际社会对中国数据发展和治理能力的充分肯定,是中国科学家提升全球科技治理话语权的生动缩影。
2026-03-31 10:23
教育部30日印发《校园食品安全“十必须”》《学校食堂工作人员“十不准”》,进一步筑牢校园食品安全防线,明确中小学、幼儿园食堂不得制售冷荤类食品、生食类食品、冷加工糕点,不得加工制作四季豆、鲜黄花菜、野生蘑菇、发芽土豆等高风险食品。
2026-03-31 10:22
30日19时00分,力箭二号遥一运载火箭在东风商业航天创新试验区发射升空,将搭载的新征程01卫星、轻舟初样试飞船和天视卫星01星顺利送入预定轨道,发射任务取得圆满成功。
2026-03-31 10:17
加载更多