点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI向真正“智能学习体”迈进
首页> 科技频道> 综合新闻 > 正文

AI向真正“智能学习体”迈进

来源:科技日报2021-02-25 09:26

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  科技日报北京2月24日电 (记者张梦然)英国《自然》杂志24日发表一项人工智能研究成果:美国团队报告了一类增强学习,可回溯过去、解决复杂任务,真正改善了对复杂环境的探索方式,有望应用于机器人、语言理解和药物设计领域。这类算法被统称为“Go-Explore”,其已经在一款经典游戏的算法挑战中得分超过了人类玩家和先进的人工智能系统。该成果被认为正朝着实现真正“智能学习体”迈出了重要一步。

  增强学习,可让人工智能系统通过探索和理解复杂环境来进行决策,并学习如何以最优的方式获得奖励。奖励可以包括机器人抵达特定位置或是在电脑游戏中达到一定的等级。然而,当遇到很少给予反馈的复杂环境时,现阶段的加强学习算法就很容易碰壁,这让人工智能专家们非常苦恼。

  美国“OpenAI”是由诸多硅谷巨头联合建立的人工智能非营利组织,推动者包括美国创业孵化器Y Combinator总裁萨姆·阿尔特曼、美国太空技术探索公司(SpaceX)创始人埃隆·马斯克等,其目标是希望能够预防人工智能的灾难性影响,并推动人工智能发挥积极作用。此次,“OpenAI”的科学家艾德兰·艾克菲特、朱斯特·赫伊津哈及团队,提出了有效探索面临的两个主要障碍,并设计了一类算法来解决这些障碍。

  研究人员表示,“Go-Explore”可以对环境进行全面探索,同时构建一个档案库来记住它去过的地方,确保自己不会忘记通往有望成功的期中阶段或是最终胜利(奖励)的路线。其在雅达利经典游戏中的得分,超过了人类玩家和先进的人工智能系统,研究人员用这类算法,解决了之前未能解决的2600个雅达利游戏,验证了这类算法的潜力。“Go-Explore”在算法挑战《蒙特祖马的复仇》中的得分是之前的4倍,在另一个算法挑战《玛雅人的冒险》中的得分也超过了人类玩家的平均水平。而相对的,此前的算法一分都拿不到。

  “Go-Explore”算法还能完成一个模拟机器人任务,在这项任务中,它必须用机械臂把东西捡起来并放到4个架子中的一个架子上,其中两个架子被关在两扇门的后面。

  研究人员指出,记住并回到有望成功的探索区域的简单原则是一种强大、通用的探索方法。他们认为最新的算法有望应用于机器人、语言理解和药物设计。

[ 责编:武玥彤 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2026年世界青年发展论坛在武汉开幕

  • 我国夏粮小麦收获已近九成

独家策划

推荐阅读
韩国首尔国立大学工程学院科学家研制出一款高性能有机发光二极管,集成了高导电性透明金属电极,透光率超过93%,有望在先进显示器等众多领域大显身手。所得器件兼具优异的透明度与电致发光性能,底层的有机层也安然无恙,充分彰显出该技术在下一代透明显示应用中的巨大潜力。
2026-06-16 09:27
《自然·医学》杂志15日报道了一种皮质内脑机接口(BCI)突破。该参与者累计使用该系统超过3800小时,共发出183060个句子(近200万词),平均每分钟56词,其中92%的句子被评定为“基本正确”或更佳。
2026-06-16 09:26
未来产业是科技创新和产业创新深度融合的产物,是技术突破催生的全新赛道,对于发展新质生产力具有先导性、引领性作用。未来产业的根基在于创新,没有源头创新,就没有未来产业的萌芽;没有持续创新,就没有未来产业的壮大。统筹科技自立自强与全球创新合作是夯实未来产业发展根基的关键。
2026-06-16 09:25
随着高密度发射成为常态,力箭一号火箭控制系统逐步实现软、硬件产品全链路自主可控。“目前,箭上配套设备缩减50%,地面设备削减80%,火箭电测周期由原来的1个月压缩到1周以内。
2026-06-16 09:23
作者:尚俊杰、王淑文(分别系北京大学教育学院副院长兼学习科学实验室执行主任、中国高等教育学会学习科学研究分会常务副理事长兼秘书长;将学习科学的研究成果深度融入AI教育系统的设计、开发与应用全过程,是提升教育质量、避免技术滥用的关键。
2026-06-16 09:22
数据显示,今年4月,中国汽车出口继续保持快速增长,同比增长超过70%,其中,新能源汽车表现最为亮眼,当月出口43万辆,环比增长16%,同比增长约110%。在海外社交媒体上爆火的“中国汽车”标签,以一种独特的方式为中国的全球气候治理贡献写下新注脚。
2026-06-16 09:17
随着人工智能技术的不断突破和应用场景的加速拓展,AI相关领域人才需求攀升将成为未来较长一段时间内劳动力需求的重要趋势特征。企业作为劳动力市场的需求主体,也应主动应对AI技术变革,推动内部数字化转型,提升生产效率。
2026-06-15 09:17
智能经济带来的技术提升,不是对传统产业的简单替代,而是通过“人工智能+”行动实现全方位赋能。面对全球人工智能治理规则正在形成的窗口期,我国既要在技术上对标一流,更应在治理上贡献智慧,助力全球AI治理变革。
2026-06-15 09:16
过了芒种,在河南省获嘉县照镜镇樊庄村,村民宋其文家里的麦田已开镰,但他不慌不忙,心里稳得很。宋其文感受到的智慧灌溉来源于水肥一体机搭载的作物高效用水智能决策系统,在那里,天空地数据持续搜集,不断优化生成实时灌溉决策方案。
2026-06-15 09:16
在率先落地的机器人、数字人营业性演出场景中,符合条件的经营主体可将机器人、数字人作为演职人员纳入管理范畴。”  北京经开区有关负责人表示,下一步将持续优化试点流程、稳步扩大试点范围,做到放而不乱、管而有序、服务到位,全力扶持新业态、培育新主体、壮大新产业。
2026-06-15 09:15
6月14日,国家防总办公室、应急管理部组织自然资源部、住房城乡建设部、交通运输部、水利部、中国气象局等多部门联合会商,研判近期降雨发展趋势,研究部署重点地区防汛工作。
2026-06-15 09:13
在“环保智慧大脑”的加持下,河南省重点环境问题平均存续时间从17.4小时压缩至1.09小时,生态环境监管能力显著提升。近年来,河南省生态环境厅坚持科技创新驱动、智慧化引领,生态环境监管进入全流程智能化监测、执法、应急处置的数智化时代,环境治理格局正在重塑。
2026-06-15 09:13
据英国《自然》网站9日报道,美国生命生物科学公司当天宣布,首次通过细胞“部分重编程”疗法,尝试让一名青光眼患者眼部受损的衰老细胞“返老还童”。
2026-06-12 09:32
一项发表于《科学》杂志的最新研究,绘制了首张全球菌根真菌“地下网络”分布图。这是继去年《自然》杂志发表菌根真菌多样性全球分析之后,科学家首次实现对其物理密度的全球可视化。
2026-06-12 09:29
斯坦福大学数学家贾里德·杜克尔·利希特曼在社交平台X上将这种现象类比为国际象棋中的“非常规开局”,认为AI有时能跳出人类长期形成的“审美与惯例”。
2026-06-12 09:28
在前不久举行的第三十四届哈尔滨国际经济贸易洽谈会上,哈尔滨工程大学智能海洋航行器技术全国重点实验室的展台前,围满了参观者。
2026-06-12 09:27
如今,智谱的大模型已经成为全球众多顶级云服务商和知名编程平台的“默认选项”之一,深受海外开发者的欢迎。如果说智谱代表了AI通用大模型在信息空间的实力,那么北京科学智能研究院则展示了AI征服物理和微观世界的强大力量。
2026-06-12 09:26
“在洞窟里,把冷光灯打开,面对着千年壁画的那一刻,所有的烦恼都会瞬间远离,觉得能近距离接触如此杰出的艺术品,是很震撼、很幸运又很幸福的事。遵循这一“笨规矩”,于宗仁组织完成了莫高窟与甘肃省内外多处壁画彩塑保护方案与实施工作,例如莫高窟千像塔彩塑保护修复、莫高窟第196窟壁画彩塑保护修复,以及麦积山石窟部分洞窟的塑像壁画保护修缮等。
2026-06-11 10:23
国际科技出版机构施普林格·自然10日发布的自然指数2026科研领导者榜单显示,中国继续保持全球第一,2024年至2025年科研产出增长22.4%,是全球十强中唯一实现两位数增长的国家。机构表现方面,自然指数显示,中国科学院整体排名位列榜首,在除健康科学和社会科学以外的5个学科领域位居第一。
2026-06-11 10:23
量子传感是一种利用量子效应进行高精度测量的新技术。量子传感可通过增加粒子数量来提高传感性能,然而这面临一个重要挑战——量子热化。“这不仅深化了人们对量子热化这一基础科学问题的认识,也为发展新一代高灵敏度量子传感器提供了新的思路。
2026-06-11 10:23
加载更多