点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI大模型加速落地 “新蓝海”如何开拓
首页> 科技频道> 综合新闻 > 正文

AI大模型加速落地 “新蓝海”如何开拓

来源:光明网-《光明日报》2024-08-05 09:45

  上海,观众在世界人工智能大会上的AI模型平台屏幕前交流讨论。新华社发

  云南昆明,观众在第八届南博会上等待AI机器人制作素描画像。新华社发

  工作人员在湖北武汉一家AI智慧产业园的展示中心内工作。新华社发

  【圆桌对话】

  【编者按】

  当前,生成式人工智能技术在多个领域展现出广泛的应用潜力,逐渐成为科技领域的关注焦点。

  国家互联网信息办公室最新数据显示,截至目前,我国已经完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已达180多个,注册用户突破5.64亿。

  大模型如何进一步赋能千行百业?今后还需要在哪些方面重点发力?本期,我们邀请专家学者就生成式人工智能发展过程中遇到的难点问题和未来发展趋势进行探讨,为读者呈现这一领域的最新动态。

  大模型是通向通用人工智能的路径吗?

  记者:有人说,大模型改变了人类对于整个世界的认知方式,让我们看到了实现通用人工智能的路径。您对这个观点怎么看?

  朱晓峰:相较于传统的人工智能,以大模型为核心的人工智能具有自主生成能力,不再是人类工程师教它什么,它会什么,而是在一定程度上像人类一样具有了自主学习和输出能力,可以从事那些人类工程师未事先赋予其相应能力的工作。这与通用人工智能的方向具有一致性。一般认为,通用人工智能具备三个关键特征,分别是自主定义任务、完成无限任务以及由价值驱动。虽然现有的生成式人工智能还不具备其中的任何一个特征,但大模型的出现和迅速发展,使我们看到了实现通用人工智能的可能道路。从这个意义上讲,这个判断是准确的。

  严骏驰:大模型技术正在以惊人的速度重塑我们对世界的认知,并为未来的智能技术开辟了广阔的前景。这些技术通过处理和分析大量数据,展现出了令人瞩目的智能特性。然而,要实现真正的通用人工智能,我们可能还需要更深入的理解和更复杂的技术创新。

  一方面,我们要知道大模型的“智能”并不是真正意义上的“智能”。当前的大型模型虽然在规模上达到了前所未有的水平,但它们的智能层次仍有局限性。这些模型能够执行特定的记忆任务,然而,真正的智能远不止于此。它涉及复杂的因果推理、逻辑思维等高级认知能力,这些是目前大模型所缺乏的关键要素。要实现通用人工智能,我们必须超越这些局限,模拟出更接近人类智能的全面认知能力。

  另一方面,我们需要了解实现真正“智能”的关键所在。大模型的智能程度高度依赖于数据和计算资源,这种依赖导致它们的智能更多是基于统计和记忆,而非深刻的理解或创造性。真正的智能应该能够识别和纠正现有知识的不足,并有能力探索和创造新知识。这是目前大模型所未能触及的领域,也是未来智能技术发展的关键所在,我们还需要创新的算法和更深层次的认知理解。

  大模型技术的发展为我们展示了实现通用人工智能的潜在路径,未来的智能技术发展将依赖我们在认知模型、算法创新和伦理研究等方面的持续努力和探索。

  陈昌凤:反过来说,是人类的认知革命驱动了大模型的诞生。大模型是科学发展与哲学变迁的产物。牛顿经典力学理论带动了自然科学的第一次大发展,催生了与之相适应的哲学思维——整个宇宙是机械运动的结果,生命乃至人类也可被看作机器,生命运动可以用机械运动去解释了。

  从20世纪中期开始,伴随着生物学和计算机科学的发展,人们尝试以计算的抽象思维去认识和把握世界。人工智能的奠基者图灵把人的大脑看作离散态的机器,论证认为人类心灵活动实质上是信息处理过程。计算机的奠基人冯·诺依曼提出细胞自动机的理论,认为生命的本质是计算的过程,此后更多的研究用计算思维来认识和理解生命,将生命的过程还原为计算的过程。

  认知科学由此也掀起了变革热潮。人类智能的可计算性是基础,认知计算主义认为,人类大脑和计算机都被看作一套处理符号的形式系统,人类的计算、感知和认知等智能行为,都可以被数据化、符号化,成为计算机模拟、处理的对象。这些都是人工智能发展的理论基础。在尝试了不同的路径之后,辛顿等科学家研究出了深度学习、神经网络系统,从而驱动了这一轮大模型的诞生。可以肯定的是,这一场技术变革将带来更深层次的认知变革,将进一步破解人类的思维密码。

  高质量中文语料短缺难题如何破解?

  记者:目前普遍认为,大模型技术的发展仍面临诸多挑战,其中最突出的问题之一是数据支持的不足,尤其是高质量的中文语料短缺,难以支撑算法模型的持续迭代和优化。这个问题如何破解?

  陈昌凤:当前,国际最先进的大模型几乎已经“学完”了人类已有的可获得的数字化文献。有研究指出,根据2023年数据消耗速度,高质量语言数据将在2026年前被耗尽,低质量语言数据将在2030年至2050年被耗尽;视觉数据将在2030年至2060年被耗尽。

  国际上,文本数据使用殆尽,而数据流通与版权保护形成的矛盾也限制了大模型的数据可使用性。已经有很多信息巨头公司正在将视觉化信息、音频类信息转为可训练的文本数据。有消息指出,大量转录的音频数据已经用于模型训练,不少“合成数据”也已经开始受到青睐。

  中文数据方面确实存在先天不足。一方面,在上世纪末的数字化浪潮中,中文领域对数字化的重视和投入均不足,初期的数字化信息质量也参差不齐,欠缺再利用的价值;另一方面,网络信息存储和数据化建设均难与技术发展相同步、相匹配。此外,迄今引进的部分数据库,带着固有的价值观烙印。亡羊补牢,为时未晚。如果从顶层设计部署到实践落实能够重视、弥补,相信仍有意义。

  严骏驰:在大模型技术发展的道路上,高质量中文语料的短缺问题日益凸显,成为制约技术迭代和优化的重要因素。为解决这一挑战,可以通过以下措施来提升中文语料的质量和可用性:

  一是挖掘和整合国内中文资源。我国拥有庞大的中文报纸、期刊、网站和App资源,这些都是构建高质量中文语料库的重要基础。例如,中国的报纸种类繁多,App市场活跃,国家图书馆的中文藏书也极为丰富。我们需要深入挖掘和整合这些资源,以提升中文语料的质量和多样性。

  二是加强数据合规监管。政府部门和监管机构需要建立相应的监管机制,以确保人工智能领域的数据合规。这包括对大模型的数据采集来源、处理方法以及合规性进行监督和审查。同时,我们还需建设集中的数据共享平台,在保证数据合规的前提下,增强中文数据的可用性,以推动大模型技术的发展,同时保障各方的合法权益。

  朱晓峰:还有两点也很重要。一是建立统一的中文语料库编码规范标准,提高中文语料数据的可使用性。我国目前的中文语料库的国家标准有《信息处理用现代汉语分词规范》《信息处理用现代汉语词类标记规范》等,但这些只是作为推荐性标准,行业采用率不高。实践中不同中文语料库采用不同的编码规范标准,形成了语料库之间的异构性,数据资源之间难以相互转换,同时导致重复建设。对此,考虑到元数据标准规范是中文语料库标准规范中最有条件、最容易实行的规范,可以依据这一规范,建设相应的中文语料库。

  二是建立Web检索,搭建由国家、省市图书馆和各高校图书馆主导的中文语料库资源共享平台,推动中文语料库共享进程。Web检索为语料库的访问提供了便利,但在实际应用中,尤其是对于语言信息处理研究和人工智能的使用来说,往往需要获取语料库的全文或特定子库的内容,这就对现有的Web检索系统提出了更高的要求,即需要建立更加广泛、全面且易于使用的中文语料库资源,以便满足这些高级需求。这意味着在现有Web检索技术的基础上,还需要不断优化和完善语料库的组织结构、检索方式以及用户界面等,以提高语料库资源的可访问性和易用性。

  大模型的“新蓝海”在哪里?

  记者:目前,大模型已经在自动驾驶、医疗健康等领域展现出巨大潜力。未来,大模型可能会在哪些领域开拓出新的“蓝海”市场?

  陈昌凤:大模型横空出世不足两年,一些“大模型”已经朝着“小模型”的方向转变,比如着力于开拓垂类应用模型——教育类、金融类、政务服务类、媒体类、医疗健康类等,并取得了可见的成效。一些可能朝着更细化的AI Agent(智能体)应用方向发展。目前一些人工智能产业正从应用层中寻求创新和价值。

  严骏驰:现阶段,我国生成式人工智能的应用主要聚焦于医疗、汽车、教育、金融、文化等消费级场景,但在高精尖领域,如自动化定理证明、电路芯片设计、科学文档理解和发现以及图表理解等方面,大模型技术的应用潜力尚未得到充分开发。这些领域对于技术的要求更高,同时也具有更大的创新空间。

  大模型技术在数学和逻辑推理方面有很大的潜力。通过处理和分析大量的数学和逻辑数据,大模型可以辅助自动化定理证明,提高证明过程的效率和准确性。例如,大模型可以辅助证明复杂的数学定理,帮助数学家解决一些长期未解的问题。此外,大模型还可以辅助自动化推理,例如在编程语言和形式化验证中的应用,从而提高软件开发和系统设计的效率和质量。

  大模型技术在芯片设计领域也值得关注。通过引入大模型技术,可以优化设计工作流程,缩短设计时间,并优化功耗、性能和面积。这不仅提高了设计效率,还帮助开发者解决整个系统堆栈中的复杂问题。此外,大模型还可以协助完成一些重复性的探索工作,帮助开发者更快达成目标,如优化测试周期、提高覆盖率并最小化测试向量数量等。

  大模型技术在科学文献分析方面的应用也显示出巨大潜力。通过处理和分析大量的科学文献数据,大模型可以帮助科学家更好地理解和发现科学知识。例如,大模型可以辅助科学家从大量的科学文献中提取关键信息,发现新的科学关联和趋势,从而推动科学研究的进展。此外,大模型还可以辅助科学文献的自动分类和索引,提高科学文献的检索效率和准确性。

  在大模型技术的发展中,图表理解领域的研究也值得期待。大模型技术能够帮助理解和分析图表数据,提取关键信息,并应用于各种领域,如市场分析、金融预测等。这种技术的应用能够提高数据分析和决策制定的效率和准确性。

  朱晓峰:大模型技术的特性和产业发展的要求决定了其需要大规模和长周期的投入和布局。在此过程中,我们不仅要尊重市场规律,肯定企业自身的努力,更要充分发挥国家层面的引导作用。例如在大模型基础设施建设、产业引导等方面,做出更多政策上面的引导和支持。

  同时,在一些特定领域,如医疗、生命科学、数字城市等,我国拥有独特的优势。应当充分利用并发挥这些优势,通过大模型来驱动创新,从而带动人工智能产业的全面发展进步。

  主持人:

  记者 方曲韵

  本期嘉宾:

  清华大学新闻与传播学院教授 陈昌凤

  中央财经大学法学院教授 朱晓峰

  上海交通大学人工智能学院教授 严骏驰

[ 责编:焦子原 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 文化遗产数字化论坛开幕倒计时1天

  • 倒计时1天!人工智能安全治理分论坛即将举行

独家策划

推荐阅读
人工智能的浪潮正在席卷从科技到教育,乃至全社会的各个角落,中国教育界正在积极推动学习和应用人工智能,以便乘势站在时代前列。今年6月,中国工程院院士、华中科技大学校长尤政提出,人工智能和批判性思维结合形成DNA式的“双螺旋结构”,将有力推动创新。
2025-09-16 09:14
15日,在2025年国家网络安全宣传周主论坛上,《人工智能安全治理框架》2.0版正式发布。落实《全球人工智能治理倡议》,《人工智能安全治理框架》1.0版于2024年9月发布,受到国内外广泛关注。
2025-09-16 09:13
光明日报北京9月15日电 记者陈晨从农业农村部获悉,2025畜禽种业发展论坛14日在北京市平谷区举行。论坛发布了第三次全国畜禽遗传资源普查、濒危畜禽遗传资源保护成效、主要畜种分子身份证构建和遗传评估优秀种公畜等重大成果,举办了畜禽种业振兴成果展,26家单位现场推介新技术、新设备、新成果,72家单位进行专场展示。
2025-09-16 09:13
数智技术以及数智互联技术将推进青年间社会化协同与知识共享,可精准连接青年学习者,并形成跨地域的学习社群与项目协作组。总而言之,数智技术能够为青年群体参与终身学习创造良好条件,能够充分激发青年群体参与终身学习的动力,能够更好地帮助青年群体全面发展。
2025-09-16 09:12
作者:王 珩、程松泉,分别系浙江师范大学教师教育学院教授;浙江师范大学教师教育学院博士生  当前,全球教育正经历一场由人工智能技术驱动的深刻变革。唯有坚守育人初心,在伦理框架内审慎推进技术应用,才能让人工智能真正成为引领教育发展的引擎,而非解构教育本质的飓风。
2025-09-16 09:11
在合成生物学和气候变化应对领域有巨大潜力。
2025-09-16 09:11
走进展区,多款新潮文创让人爱不释手;戴上设备,苏轼笔下的诗词世界任人遨游;指尖轻点,三千年前的青铜器“触手可及”……一系列新产品、新服务、新场景在2025年中国国际服务贸易交易会文旅服务专题亮相,漫步其中,处处感受到科技与创意奔涌、文化和旅游融合的无限活力。
2025-09-15 09:54
在2025年中国国际服务贸易交易会上,一批品类丰富、兼具趣味与文化内涵的文创精品成为展会现场的“人气王”,引爆观展热潮。
2025-09-15 09:54
最大网络基础设施的建成有助于我国突破关键技术的“卡脖子”困境,形成自主可控的核心技术优势,建立起数字经济产业的第二创新生态。 (作者:戎 珂,系清华大学社会科学学院经济学研究所所长、长聘教授;田晓轩,系清华大学社会科学学院经济学研究所博士研究生)
2025-09-15 09:53
今年暑期,工厂游火爆出圈。参观名额秒空、门票收入可观、社交平台相关笔记有10多万条,工厂游俨然成了文旅界新宠。 工厂游等新型旅游业态,实现了工业与文旅的跨界融合,也为文旅经济的发展提供了新增长点。
2025-09-15 09:52
深夜,河南焦作多氟多新材料股份有限公司的实验室依旧灯火通明,总工程师闫春生还在带着团队忙碌。 2006年,多氟多打响了由传统氟化工向精细氟化工、新能源材料转型的战役,闫春生临危受命加入六氟磷酸锂研发团队。
2025-09-15 09:51
2025年中国国际服务贸易交易会9月10日至9月14日在北京举办,众多科技产品亮相展区,吸引观众驻足参观。2025年中国国际服务贸易交易会9月10日至9月14日在北京举办,众多科技产品亮相展区,吸引观众驻足参观。
2025-09-12 10:08
汽车排放被认为是气候变化的“元凶”之一,但学术界一直缺乏对城市道路碳排放进行精准刻画的工具。”借助全景AI模型,可实现二氧化碳排放源的精准提取,模型的平均精度超过93%、平均误差低于1.3ppm(ppm为百万分比浓度)。
2025-09-12 10:01
习近平总书记指出:“要把握人工智能发展趋势和规律,加紧制定完善相关法律法规、政策制度、应用规范、伦理准则,构建技术监测、风险预警、应急响应体系,确保人工智能安全、可靠、可控。人工智能系统的可靠性不能停留在统计意义上的“高概率正确”,而应追求在复杂、开放、动态环境下的“高置信可靠”。
2025-09-12 10:01
10日,2025世界顶尖科学家协会奖(以下简称“顶科协奖”)获奖者名单在上海公布。顶科协奖是2021年在上海发起创设、由红杉中国独家提供永久资金支持的面向全球科学家评选的科学大奖。
2025-09-12 09:59
全球规模最大恐龙蛋化石群——湖北十堰青龙山恐龙蛋化石群的埋藏时代,首次被科学家认定为距今约8600万年。专家考证,这是迄今全球分布最集中、规模最大、埋藏最好、原地出露最多、原址保存最好的恐龙蛋化石群。
2025-09-12 09:58
9月10日上午,在马来西亚吉隆坡召开的国际灌排委员会第七十六届国际执行理事会会议上,2025年(第十二批)世界灌溉工程遗产名录正式公布,我国申报的云南元阳哈尼梯田、江苏句容赤山湖灌溉工程、四川彭州湔江堰、北京门头沟永定河古渠灌溉工程全部成功入选。
2025-09-11 10:18
“十四五”以来,我们牢固树立和践行绿水青山就是金山银山的理念,全力当好自然资源“大管家”和美丽中国“守护者”,全面完成了“十四五”规划的目标任务,有效支撑了经济社会的高质量发展。
2025-09-11 09:57
未来,城市的画卷上,AI、物联网与大数据等现代科技将继续深化推广,但唯有始终以人的尺度丈量技术,以人文的关怀驾驭创新,方能使城市永葆文气的深度、人气的热度与烟火气的温度,让每座城市都在科技的守护中,找到生生不息的发展动能。
2025-09-11 09:52
北京大学的科研团队与合作者联合开发出一种全新的“高维超分辨成像”技术,成功实现了对活细胞内15种细胞器的同时成像与精准识别,为细胞生物学研究打开了一扇全新的大门。
2025-09-11 09:43
加载更多