点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:人工智能“迎战”奥数难题
首页> 科技频道> 综合新闻 > 正文

人工智能“迎战”奥数难题

来源:科技日报2024-08-05 10:11

  IMO中的问题涵盖了多个数学领域。但大多数IMO问题都是用英语编写的,需要翻译成AI能理解和验证的编程语言,才能让AI进行机器学习。

  图片来源:《自然》网站

  【今日视点】

  继击败人类围棋大师和战略棋盘游戏顶尖高手之后,谷歌“深度思维”公司人工智能(AI)系统在英国巴斯举行的2024年国际数学奥林匹克竞赛(IMO)上,仅以1分之差与金牌失之交臂,获得了银牌。这是AI选手首次登上IMO领奖台。

  英国《自然》杂志网站在7月27日的报道中指出,“深度思维”正与其他公司竞相解决数学领域的疑难问题。近年来,IMO被广泛认为是对机器学习的一个挑战,也是衡量AI系统高级数学推理能力的理想基准。AI系统在今年IMO中的精彩表现,标志着其即将再下一城:在解决数学难题方面击败世界顶尖学生。

  首登领奖台

  “深度思维”公司训练了一个专门用于解答数学奥赛考题的AI系统,成功解答了6道竞赛题中的4道,获得28分(满分42分),达到本次比赛银牌获得者的水平。

  该系统包括解答数学推理问题的模型AlphaProof和解答几何问题的模型AlphaGeometry的升级版AlphaGeometry 2。其中,AlphaGeometry 2解决了一个几何问题,而AlphaProof则解答了两个代数问题和一个数论问题。

  今年1月份,AlphaGeometry在解决欧几里得几何问题上,就已表现出奖牌级选手的水平。在今年的IMO比赛前,AlphaGeometry 2已经能够解决过去25年里83%的IMO几何问题,而其“前身”仅能解决53%。

  “深度思维”公司AI科学副总裁普什米特·科利指出,这是AI系统首次达到获IMO奖牌级别的性能。IMO主席格雷戈尔·多利纳尔也表示,AI最终将能比人类更好地解决大多数数学问题,其进步速度令人惊叹。

  几乎同一时间,软件公司Numina的科学家使用语言模型,赢得了AI数学奥林匹克奖(AIMO)的首个“进步奖”。

  但Numina团队在获奖后表示,要解决更难的数学问题,仅靠语言模型可能还不够。

  与自己对抗

  AlphaProof是一个自学习系统,其核心创新在于结合预训练语言模型与AlphaZero强化学习算法的策略。强化学习是机器学习领域一种重要的学习范式,系统可通过多次尝试找到自己的解题方法。

  这种方法需要用AI能理解和验证的语言编写大量问题,而大多数IMO问题都是用英语编写的。为解决这个问题,“深度思维”团队托马斯·赫伯特及其同事使用谷歌的大语言模型Gemini,将这些问题翻译成一种名为Lean的编程语言,以供AI进行学习。

  AlphaProof使用经过微调的Gemini模型,自动将数学问题转换为Lean语言,从而创建了一个涵盖不同难度级别的大型问题库。在强化学习阶段,系统每验证一个证明,就用它来强化AlphaProof的语言模型,提高其解决后续更具挑战性问题的能力。

  赫伯特表示,在挑战围棋游戏时,他们也采用了类似的方法:AI通过与自己对抗,来学习如何更好地玩游戏。结果显示,在某些情况下,AlphaProof能够在无限多的可能性中迈出正确的一步,展现出“灵光一闪”的能力。

  仍有改进空间

  尽管AlphaProof的表现令人印象深刻,但其速度相对较慢,解决3个问题耗费了3天时间,而人类参赛者仅需4个半小时。此外,它也未能回答两个与组合数学有关的问题。

  英国数学家约瑟夫·迈尔斯审查了AI在本次IMO比赛中给出的答案。他指出,AlphaProof采取的这些技术能否予以完善还有待观察。

  英国伦敦数学科学研究所何杨辉称,AlphaProof这样的系统对于帮助数学家证明问题很有用,但它无法帮助研究人员确定需要解决和研究的问题。

  “深度思维”团队表示,他们正继续探索多种用于推进数学推理的AI方法。未来,数学研究者将与AI合作验证假说,尝试新方法来解决长期未解决的数学难题。他们也希望AlphaProof能够通过减少错误响应,帮助改进谷歌的大型语言模型。(记者 刘 霞)

[ 责编:焦子原 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 杭州临安开启科普宣传周活动

  • 美联储降息50个基点开启宽松周期

独家策划

推荐阅读
卡塔尔威尔康奈尔医学院科学家通过分析391名志愿者的血液、尿液和唾液样本中的数千种分子,绘制出人体及其复杂生理过程的分子图。
2024-09-19 09:43
(记者付丽丽)世界气象组织(WMO)近日发布的最新通报显示,今年9月至11月出现拉尼娜现象的概率为55%,而今年10月至明年2月出现拉尼娜现象的可能性会增加至60%,厄尔尼诺现象在此期间再次发展的概率微乎其微。
2024-09-19 09:43
在中国加入国际原子能机构40周年之际,我国决定面向世界各国开放12个核科研设施和实验平台。
2024-09-19 09:35
我国目前海拔最高的人工影响天气观测平台——中昆仑山顶人工影响天气云水资源综合观测系统平台日前已完成验收,正式投入使用。
2024-09-19 03:35
日前,清华大学戴琼海团队在《细胞》上发表最新工作成果,宣布新一代介观活体显微仪器RUSH3D系统的问世。
2024-09-19 03:35
将为我国下一代星地海量数据传输体系规划和我国新一代卫星地面站网建设奠定坚实的基础。
2024-09-18 18:36
9月上中旬,本报派出多路记者参与“铸牢共同体 中华一家亲”主题宣传“雪域高原焕新貌”调研采访活动,记录下青藏高原生态保护的西藏实践。
2024-09-18 03:15
“水库总库容22.49亿立方米,相当于360个西湖。”站在160多米高的大坝上,中核集团新华发电新疆叶河公司副总经理、总工程师孟涛一脸自豪。
2024-09-18 02:55
记者从中国气象局获悉:中国气象局能源气象重点开放实验室已于近日正式启动。实验室依托中国气象局公共气象服务中心、中国华能集团有限公司、中国科学院大气物理研究所三家单位组建,并设有学术委员会。
2024-09-18 09:59
眼下,在红河哈尼梯田元阳核心区的阿者科村,梯田即将迎来收割,不时能听到村民们在家里磨镰刀的声音。梯田红米、稻田鱼、鸭蛋等当地绿色特优产品知名度、美誉度不断提高,产业的发展让世界遗产品牌惠及当地群众。
2024-09-18 09:54
一项新研究称,海洋鱼类的灭绝风险远高于国际自然保护联盟(IUCN)的初步估计,从2.5%增加到12.7%。法国蒙彼利埃海洋生物多样性、开发和保护部门研究人员称,IUCN撰写的《濒危物种红色名录》覆盖了超15万个物种,指导全球各地保护最受威胁的物种。
2024-09-18 09:52
记者17日从中国科学院云南天文台了解到,该台恒星物理研究团组和天文技术实验室近期基于机器学习,合作开发了快速计算恒星—行星系统潮汐演化的方法。
2024-09-18 09:34
在知识产权保护的基础上,发展中部地区地理标志特色产业,对于促进当地乡村全面振兴,赋能经济高质量发展,意义重大。
2024-09-14 09:43
据《全国科技小院发展报告(2024)》显示,自2009年第一个科技小院成立以来,科技小院数量快速增长、参与主体愈加丰富,目前全国已建成1800多个科技小院,157个研究生培养单位参与其中,参与专家达2700余名、入驻研究生1万余名。科技小院发展模式日益成熟,成为推动乡村全面振兴的重要组织力量。
2024-09-14 09:42
药品监管部门坚持以“四个最严”要求为根本遵循,着力统筹发展和安全,统筹效率和公平,统筹监管和服务,有效保障药品安全形势总体稳定,促进医药产业高质量发展。今年1至8月,国家药品抽检共计20696批次,合格率为99.43%。
2024-09-14 09:34
国内首台工业级盾构滚刀智能换刀机器人、全球首款人工智能骨科手术机器人、元宇宙数实融合应用……
2024-09-14 09:32
医生在浙江,患者在新疆。一场跨越近5000公里的5G超远程机器人肝脏肿瘤切除手术正在进行。只见医生在机器人手术操作台上,灵活地操控机械臂;手术室中,机械臂收到指令,精准地完成各项手术动作……目前,浙江各医院已完成50余例援疆5G超远程机器人手术。
2024-09-14 09:31
每一项重大科技应用取得突破前后,均有对其理论上的持续争论。著名小说《仿生人会梦见电子羊吗?》引发的人与仿生人之间界限的讨论虽产生于20世纪,但一直延续至今,其蕴含的法律问题是人工智能究竟是否具备法律人格。
2024-09-13 10:14
移动物联网是以移动通信技术和网络为载体,通过多网协同实现人、机、物泛在智联的新型信息基础设施。
2024-09-13 10:14
据了解,“晓医”依托讯飞星火医疗大模型,基于大量资深中医诊疗经验和专业知识图谱数据,构建了规模大、覆盖病种全的知识库,包括中医病症知识“400+”种、穴位知识“400+”种、常用中草药“300+”种、古代医案“6200+”份等。
2024-09-13 10:13
加载更多