正在阅读: 自动化所在类人连续学习及情境依赖学习方面取得进展
首页> 科技频道> 综合新闻 > 正文

自动化所在类人连续学习及情境依赖学习方面取得进展

来源:自动化研究所2019-08-12 15:52

调查问题加载中,请稍候。
若长时间无响应,请刷新本页面

  中国科学院自动化研究所脑网络组研究中心与模式识别国家重点实验室团队提出正交权重修改算法,与情境信息处理模块相结合,使人工神经网络具备了强大的连续学习和情境依赖学习能力,有效解决灾难性遗忘等难题。相关成果已在线发表于Nature Machine Intelligence。

  人工智能已成为21世纪最具挑战性的前沿科学领域之一,但究竟什么是“智能”?可以确定的是,个体对复杂、动态环境的高适应性是智能的重要标志。

  人类大脑显然是高环境适应性的典范。人不仅可以在新的环境中不断吸收新的知识,而且可以根据不同的环境灵活调整自己的行为。在此方面,深度神经网络(deep neural networks,DNN)与大脑相比存在着很大的差距。传统DNN一方面会受到“灾难性遗忘”问题的困扰,难以在学习新知识的同时保留旧知识,即缺少连续学习(continual learning)的能力;另一方面,DNN往往只能实现预先训练好的固定操作,不能对实际环境中存在情境信息(比如自身状态、环境变化、任务变化等)做出灵活的响应,难以满足复杂多变的需求,即缺少情境依赖学习(contextual-dependent learning)的能力。这两方面能力的缺失是制约当前DNN发展出高水平智能的重要瓶颈。

  近日,自动化所脑网络组研究中心与模式识别国家重点实验室余山课题组在克服上述两个核心问题方面取得新进展,为提高人工智能系统对于复杂多变环境的适应性提出了新的思路和方案。在Continual Learning of Context-dependent Processing in Neural Networks 一文中,硕士生曾冠雄、博士后陈阳等提出了正交权重修改(orthogonal weights modification,OWM)算法和情境依赖处理(context-dependent processing,CDP)模块。OWM算法可以有效克服神经网络中的灾难性遗忘,实现连续学习;受大脑前额叶皮层启发的CDP模块可以有效整合情境信息,调制神经网络的信息处理过程。二者的有效结合,使人工神经网络具备了强大的连续学习和情境依赖学习的能力,大大增加了其灵活性和适应性。

  OWM算法的核心思想为:在学习新任务时,只在旧任务输入空间正交的方向上修改神经网络权重。如此,权重增量几乎不与以往任务的输入发生作用,从而保证网络在新任务训练过程中搜索到的解,仍处在以往任务的解空间中。OWM通过正交投影算子P与误差反传算法得到的权重增量△WBP作用实现其目的,即最终的权重增量为△W=κP△WBP。

  OWM算法实现了对网络中已有知识的有效保护,并可以与现有梯度反传算法完全兼容,在连续学习测试任务中表现出了良好的性能。在连续学习的标准任务disjoint MNIST与shuffled MNIST任务中,OWM算法的表现超过了同类的其他算法。并且,随着学习的任务数目增加,OWM算法的性能优势会进一步加大。利用OWM算法,神经网络可以连续学习识别ImageNet的1000类图片和3755个中文手写体汉字(每个任务仅训练一类图片或一个汉字)。值得一提的是,算法具有优良的小样本学习能力,以手写体汉字识别为例,基于预训练的特征提取器,系统可以从仅仅数个正样本中就能连续地学习新的汉字。

  CDP模块则是受前额叶皮层启发提出的。前额叶是大脑中负责认知控制的核心皮层。其同时接收感官输入和情境信号,并选择与当前任务最相关的感官信号指导输出响应。受此启发,作者引入了类似的处理架构——CDP模块,它包括两个子模块:1.编码子模块,其负责将情境信息编码为适当的控制信号;2.“旋转”子模块,其利用编码模块的控制信号处理任务输入(由于其功能上相当于将特征向量在高维空间上进行了旋转,故称为“旋转”子模块)。

  若将CDP模块与OWM算法联合使用,神经网络只需要一个分类器,就可以连续学习40种不同的脸部特征的识别任务。并且,当不同的提示信号出现时,其对相应的特征做出判断,效果与引入40个分类器的情况相当。

  通过OWM算法有效克服灾难性遗忘,并通过CDP模块实现单个网络基于情境信号的多任务学习,二者结合有望让智能体通过连续不断的学习去适应复杂多变的环境,从而逐步逼近更高水平的智能。

自动化所在类人连续学习及情境依赖学习方面取得进展

  OWM算法原理示意图。(a): 在权重更新时,OWM算法只保留传统BP算法计算的权重增量中与历史任务输入空间正交的部分。(b): 在新任务中,OWM算法将神经网络对解的搜索范围约束在旧任务的解空间中。

自动化所在类人连续学习及情境依赖学习方面取得进展

  在连续学习MNIST手写体数字0-9的任务中,随着任务数目的增加,OWM算法的优势也愈加明显。同时,任务的学习顺序会对个别任务产生影响。如先学数字4和7,会显著提升数字9的识别正确率。

OWM算法在ImageNet和中文手写体汉字识别的连续学习任务上体现出优良的性能

自动化所在类人连续学习及情境依赖学习方面取得进展

OWM实现汉字识别的小样本连续学习

自动化所在类人连续学习及情境依赖学习方面取得进展

类前额叶的CDP模块的结构设计。左上角是其工作原理示意图。

自动化所在类人连续学习及情境依赖学习方面取得进展

  同一个分类器对于同样的输入,连续学习40种不同人脸属性的分类任务(蓝色数据点),正确率与用40个分类器的系统(橙色线)几乎一致。

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平考察新县田铺乡田铺大塆

  • 浙江海宁:钱塘潮“一线潮”景观

独家策划

推荐阅读
出于多方考虑,时任中科院副院长裴丽生主动向贝时璋提出:“生物物理所该有自己的房子了,你们筹备建大楼吧。这可不是闲聊,因为理论组最重要的任务是放眼全球科学大势,寻找有潜力的学科生长点,为生物物理所的未来发展探路。
2019-09-17 10:35
CAR-T细胞疗法是一种迅速兴起的免疫疗法,能利用患者自身的细胞治疗某些类型的癌症,而对于另一种危及生命的疾病——心脏病,该疗法可能是一种可行的治疗选择。
2019-09-17 09:18
自1921年在肯尼亚发现非洲猪瘟以来,科学家从未停止对疫苗的研制。然而,时至今日,还没有可以商业化生产和使用的非洲猪瘟疫苗。
2019-09-17 09:17
近日,印度“月船二号”探测器着陆月球失利的消息在朋友圈刷屏。来自系外的岩石类天体,在速度很快的情况下,撞击月表所产生的形变,和来自系内小天体撞击月表所产生的形变是不一样的。
2019-09-17 09:16
近日,一颗失控的高速恒星进入了科学家的视野。为了准确获得PG 1610+062被投射时的旋转速度、径向速度及其化学成分,研究团队需要获得恒星的光谱数据。
2019-09-17 09:16
近日,记者从中国科学院云南天文台获悉,该台与丹麦科学家合作,深入研究某些可能被忽略的物理过程对太阳结构演化模型的影响,基本解决了长期困扰国际恒星物理界的太阳丰度问题。
2019-09-17 09:15
近日,国际天文学家团队通过南非射电天文观测台(SARAO)的MeerKAT射电望远镜阵列,观测到银河系中心存在两个呈沙漏状、高度达数百光年的射电“气泡”。
2019-09-17 09:15
近日,位于澳大利亚的雅拉布巴陨石坑吸引了科学家的目光。这个源于22.29亿年前的陨石撞击坑,很有可能埋藏着宇宙生命诞生的秘密。
2019-09-17 09:14
伴随社会老龄化趋势的加速、重大疾病发病率攀升,临床对医疗检查的质量及覆盖领域要求更高。
2019-09-17 09:12
近日,由中国汽车技术研究中心有限公司主办的“自动驾驶安全与产业发展研讨会”在北京举行。会议上发布的《中国自动驾驶安全读本》认为,自动驾驶有望显著减少人为因素导致的道路交通事故,促进道路交通安全水平提升。
2019-09-17 09:11
人们多半也无法想象,餐厅里的美食是AI“炼”成的,新鲜的食材被机器大厨烹煮煎炒,出锅后由机器人送到餐桌上;此外,还有自动驾驶、人脸识别、AR试妆试衣……
2019-09-17 09:11
中国信息安全测评中心总工程师王军表示,我国网络空间形势总体向好:网络安全法律体系不断健全,网络安全管理体制机制不断完善,网络安全防护水平和应急处置能力不断提升。
2019-09-17 09:10
2019世界计算机大会近日在“银河”“天河”超算之乡湖南长沙举行,来自全球的计算机“大咖”共话计算机技术和产业的未来。
2019-09-17 09:09
在刚刚过去的中秋节,火龙果月饼、藤椒牛肉月饼等挑战味蕾的奇物层出不穷,其中一款仿制老上海鲜肉月饼的素肉月饼脱颖而出,上线的1000份很快被一扫而空。这款月饼被很多人称为“人造肉”月饼,着实在人造肉的风口上火了一把。
2019-09-17 09:08
美国哥伦比亚大学遗传学家杰拉德·卡森迪说,骨骼不只是身体的僵硬支架,其还能分泌骨钙蛋白。
2019-09-17 09:07
前不久,俄罗斯最大电信运营商移动通信公司MTS,使用中国华为的5G移动网络技术,在俄罗斯圣彼得堡州喀琅施塔得市启动了5G移动通信网络,这是俄罗斯建成的第一个5G移动网络城市。
2019-09-17 09:07
中美科学家近日报告说,他们研制出了一种比之前最黑材料还要黑10倍的材料。新材料由碳纳米管(CNT)阵列制成,可捕获99.995%的入射光,是迄今为止最黑的材料。
2019-09-17 09:06
本次活动由中国科协企业创新服务中心支持,北京市科学技术协会主办,北京科技社团服务中心指导,中关村天合科技成果转化促进中心、中关村融智特种机器人产业联盟、中关村产业技术联盟联合会联合承办。
2019-09-16 21:09
两滴仿生修补液,能让缺损牙齿表面“长”出与天然牙釉质几乎一致的修复层。论文通讯作者、浙大化学系刘昭明博士说,理想的修复方法,应该是材料、结构、力学性能三者的统一,而且能实现原位修复。
2019-09-16 09:28
横纹肌溶解综合征多伴有急性肾功能衰竭及代谢紊乱,发病原因非常复杂。在张鹏看来,横纹肌溶解最常导致的机体不良后果是急性肾功能障碍、电解质紊乱、代谢性酸中毒、休克及急性肝功能障碍。
2019-09-16 09:27
加载更多