点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:中科院院士陈润生:大语言模型存在“涌现”和“顿悟”现象
首页> 科技频道> 综合新闻 > 正文

中科院院士陈润生:大语言模型存在“涌现”和“顿悟”现象

来源:光明网2023-06-02 09:55

  光明网讯 今年以来,以ChatGPT、文心一言等为代表的大语言模型火爆出圈,人工智能(AI)能否超越人类的问题引发各界热议。5月29日,由中国智能计算产业联盟组织召开的“2023中国算力发展研讨会”在中科院计算所召开。此次研讨会以ChatGPT下算力的机遇与挑战为主题,汇集了业内多位权威专家学者,从技术、生态等多维度展开深度交流研讨,厘清算力产业的发展风向,并就当下人工智能基础设施及算力服务建设等课题给出应对之策。

中科院院士陈润生:大语言模型存在“涌现”和“顿悟”现象

  研讨会上,中国科学院院士陈润生表示,人工智能的发展不是人所能阻挡的,这是科学发展的本质。他同时指出,大语言模型中出现的“涌现(Breakthroughness)”和“顿悟(Grokking)”现象,值得大家思考。

  何为“涌现”?一个复杂系统由很多微小个体构成,这些微小个体凑到一起,相互作用,当数量足够多时,在宏观层面上展现出微观个体无法解释的特殊现象,即为“涌现”。陈润生形象地解释说,“我给它(大模型)很多学习数据,结果它的答案里面会出现学习数据里没有的事,这种现象叫涌现。”大模型的运算表明,当训练数据很大时(比如超过了1000亿),就会出现涌现现象,规模小的时候不会出现这个现象。

  需要明确的是,目前科学界对涌现现象是有争论的。比如,斯坦福大学某教授认为这是度规问题,牵扯到度量、基本物理坐标系等。

  “自然语言处理过程中,由于整个计算量的迅速增加而出现的涌现现象,这个是新问题,值得思考”,陈润生说。

  何为“顿悟”?陈润生解释,“你训练一个神经网络的过程中,一遍它不懂,两遍也不懂,第四遍还不懂,第五遍一下学会了,就像小孩学东西一样,教一两遍不懂,教到N+1遍突然就学会了。”

  他认为,这是人脑学习的一种模式,“学到某一个时间开窍了”,“计算机不可能出现顿悟,但是大模型会出现顿悟的情况”。

  不久前,ChatGPT的主要竞争对手之一Claude将语境窗口token数扩展到10万,相当于7.5万个单词,大大超越GPT-4语境窗口的8192 tokens。这意味着用户可以将高达500页的文档上传到Claude,它可以在不到1分钟之内就理解、消化这些信息,并基于上传的信息回答用户的问题。

  Claude是Anthropic公司推出的,这家公司由前OpenAI员工创立,自2022年底以来,谷歌已向该公司投资了近4亿美元。

  对此,陈润生认为,目前大模型的学习速度比我们想象中快得多,“这两家公司(OpenAI与Anthropic)你追我赶,说不定再过一段时间,GPT-5出来之后又比Claude强了,它发展那么快,将来人们赶不上。”

  “更麻烦的是,这些大模型公司都在考虑去操纵第三方设备”,陈润生说,“能够去操纵第三方设备是令人担忧的一件事情,如果操纵和安全、国防相关的东西,那就不得了了。”

  陈润生坦言,人类的神经网络结构远比目前的大模型复杂得多,人工智能的发展还有很长的路要走,“现在的(人工智能)神经网络在空间结构模型上应该有革命性的变化,也许那个时候,(AI)真的能够超越人的智力。”(记者 战钊)

[ 责编:涂子怡 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 宁夏南华山首次发现新记录植物种

  • 直击“锋刃-2025”国际狙击手射击竞赛“巅峰”比武

独家策划

推荐阅读
人机语言交互的“温度”,其核心在于能否实现情感共鸣、文化适配与价值传递。语言不仅是信息符号,更是心灵沟通的桥梁。为冰冷的代码注入人文温度,需在技术突破与设计理念上双轨并进。
2025-07-17 04:30
近日,中国科学院海洋研究所万世明团队,基于海洋沉积物中的黑碳记录,重建了过去30万年以来东亚北部的古火演化历史,结合欧洲、东亚、东南亚及澳大利亚区域的记录以及考古遗址大数据,发现现代人类大规模用火始于约5万年前。
2025-07-17 04:30
在飞行器大家庭中,有一类特别的成员——翼伞。它们没有刚硬的机翼,却凭着一片巨大柔软的“翅膀”,借助风力优雅地翱翔于天际;它们结构看似简单,却蕴含着空气动力学的精妙智慧。翼伞是融合古老降落伞原理与现代智能科技的独特柔性无人飞行器,包含翼、控制系统、负载,如果加上推力系统,就可化身为伞翼无人机。
2025-07-17 04:30
近年来,移动电源行业呈现出较为迅速的发展趋势。与此同时,移动电源安全事故频发,严重威胁消费者生命财产安全。通过制定强制性国家标准,
2025-07-17 03:55
由该院枸杞科学研究所联合中国林业科学院林业研究所编制的《枸杞属植物新品种特异性、一致性、稳定性测试指南》获得国际植物新品种保护联盟通过。
2025-07-17 04:00
武汉华大生命科学研究院联合南方科技大学等单位,在单细胞水平上成功解密了拟南芥叶片衰老的过程。
2025-07-16 10:44
不只是产量最大,“深海一号”大气田还是我国迄今为止自主开发建设的作业水深最深、地层温压最高、勘探开发难度最大的深水气田。
2025-07-16 10:42
我国正研制《卓越工程师培养认证标准》,该标准是保障卓越工程师培养从“样板间”走向宏大队伍的基础。
2025-07-16 10:39
七月下半月和八月上半月是我国主汛期的最重要阶段,应急管理部指导各地加强灾害风险隐患信息报送队伍建设,开展广泛培训,目前总人数已达115万人。
2025-07-16 10:25
为强化未成年人网络保护,营造良好网络环境,近日,中央网信办印发通知,在全国范围内部署开展为期2个月的“清朗·2025年暑期未成年人网络环境整治”专项行动。
2025-07-16 10:23
新时代新征程,以中国式现代化全面推进强国建设、民族复兴伟业,实现新型工业化是关键任务。
2025-07-15 04:10
现阶段,人工智能赋能新型工业化已取得明显成效,但仍存在人工智能关键硬件与开源软件储备不足、人工智能在重点行业领域应用率偏低、人工智能领域人才短缺且结构不合理、缺乏适应人工智能发展的标准体系和法律法规等问题。
2025-07-15 04:10
2025年可谓人形机器人的“破圈”之年。从蛇年春晚舞台的机器人扭秧歌,到北京亦庄的机器人马拉松,再到浙江杭州的机器人格斗赛……人形机器人正从“实验室”迈向各类“应用场”。
2025-07-15 02:55
科考船在狂风巨浪中剧烈摇摆,寻找渺小的目标如同大海捞针。回收沉睡海底半年的海底地震仪,是这次出海科研任务中最艰难的一环。“快看!在那儿!”随着一声疾呼划破沉寂,
2025-07-15 02:55
老北京人都知道,居家过日子,买剪刀要买王麻子的,吃腐乳要吃王致和的,穿布鞋要买内联升的…… 这是为啥?因为人家的这些物件,得劲儿呗!为啥得劲儿?匠心所致也!
2025-07-15 02:55
从27岁到60岁,33载深蓝搏击,马远良实现了中国航空声呐从无到有、从追赶到并跑乃至局部领先的壮举。
2025-07-14 08:49
何熙昱锦也表示,脑机接口技术涉及芯片、传感器、算法、应用等多个环节,需要上下游企业形成更紧密的合作关系。
2025-07-14 08:45
在论坛签约仪式上,中国、哈萨克斯坦、巴基斯坦、埃及等国家共签署12个数字经济合作项目,涉及跨境电商、智慧城市等领域。
2025-07-14 08:45
天然铀是重要的战略资源和能源矿产,铀资源勘查采冶位于核燃料循环体系的前端,是核工业发展的重要物质基础。
2025-07-14 08:42
这条从技术突破、场景深耕到生态协同的融合路径,正强劲驱动中国人工智能产业迈向高质量跃升。
2025-07-14 08:41
加载更多