语言智能的新发展与新挑战

来源：光明网2023-02-20 09:56

　　语言智能是人工智能的一个领域，主要关注人类语言的智能分析和处理，涉及语音识别、自然语言理解、自然语言生成、机器翻译等领域。近日，最能体现语言智能水平的ChatGPT引发各界的广泛关注，人们怀着极大的兴趣在讨论和尝试着这项崭新的技术成果。或兴奋，或迷茫或恐慌。兴奋的是语言智能技术真的使计算机能像人类一样和我们自如地聊天解惑了，并且话语自如、有理有据，可以拒绝不合理的提问，效果如此之好，竟引发了轰动效应；惶恐的是ChatGPT具有超强的生成能力，不仅可以聊天，还可以写文章、作诗、编码程序等，这样的话，ChatGPT就会代替人类和语言相关的工作和岗位，给人类生活带来颠覆性变化；迷惑的是我们的语言智能研究下一步朝着哪个方向走？如何理性地分析ChatGPT取得的突破和主要不足？赶上或超越它的机会和落脚点在哪里？对于语言智能的飞速发展，我们要有科学理性的态度，既要热情拥抱人工智能的新发展，让它更好地服务于人类社会，又要预防它带给我们的消极影响，看到我们的不足和差距，迎头赶上。

　　一、ChatGPT的功能与不足

　　ChatGPT是由openAI研发的一种人工智能聊天机器人程序，它是基于GPT3.5架构的大型语言模型并通过强化学习进行训练，可以和人类以自然语言对话的形式进行交互，还可以用于相对复杂的语言工作比如文本生成，自动问答，自动摘要等，同时具备一定的编写和调试计算机程序的能力。ChatGPT 的出现是语言智能领域的一大进步，标志着语言智能技术可以融合于信息搜索、人机交互、对话生成等方面，应用场景的落地具有广阔空间，潜力无穷。

　　首先，ChatGPT是一个基于深度学习的大规模预训练对话模型，主要功能是对话聊天，它通过强化学习来理解提问者的话语意图，能够较好地引入人类反馈，具备主动承认错误，区分问题是否符合伦理要求，质疑不正确的问题等，并通过清晰的逻辑思路来组织话语，距离人类的聊天方式和口气越来越近。相对于以前的对话系统，ChatGPT的主要突破在以下几点：

　　（一）超强的生成能力可以完成多种任务。ChatGPT除了与人对话聊天外，还能按照输入的关键词和表达的意图写小说、写论文、创作诗歌、作图、编写和纠正程序代码。还可以用在教案生成、资料查询、智能教学、智能创作和设计，在医疗、法律、教育、咨询服务等领域具有广阔应用前景。

　　（二）与搜索引擎相结合，基于海量数据，实现更为符合人类需求的查询结果，实现交互式搜索，给用户带来全新的体验

　　（三）交互能力大幅度提升。除了具有广博的知识，它还能很好地组织自己的话语，思路清晰，逻辑严密，“因此”“而且”“但是”等话语连接词使用恰当，几乎接近人类语言的能力。还能主动承认错误，拒绝不合理的提问等等。

　　ChatGPT的主要功能在于提供信息和社交能力，有望成为人在精神陪伴，面对挫折困难的时候提供引导和安慰的帮手。总之，ChatGPT已经成为互联网时代的语言智能的技术领跑者，给人类社会带来更加智能化和便捷化的服务。

　　当然，作为一种新兴人工智能模型，ChatGPT也存在一些问题和不足，主要在于：

　　（一）尽管对话能力和交互能力大幅度提升，但经常出现事实性错误。由于它是数据驱动的模型，对于数据背后的真实世界的状态，原理和规则等缺乏足够的认知，因此会出现一本正经地胡说八道情况。不符合常理的话语会经常出现。

　　（二）对于一般知识了解广泛，但无法提供专业性较强、有深度、有洞见的问题答案。例如对它进行物理学测试，简单常识性问题回答较好，越是难度增加，答案不能令人满意。说明ChatGPT掌握的知识并不深入、不专业。

　　（三）基于多层复杂神经网络搭建的深度学习模型，目前还不能解释其算法逻辑，经常出现事实性错误，产出的结果不具有安全性保障。如果被恶意利用，将造成严重的安全隐患，或危害法律。

　　二、ChatGPT 的工作范式

　　ChatGPT是一个基于transformer神经网络架构和生成预训练技术的大型语言模型，通过对超大型文本语料的训练，来获得语言知识和世界知识。同时它还引入基于人类偏好的强化学习方法，将其应用于自然语言建模。训练的语料，除了海量无标注数据，ChatGPT还利用标注精细的专门语料库，训练机器更高的适应性和更准确的知识。这些知识是怎么被机器获得和输出的呢？ChatGPT使用的transformer神经网络结构对数据进行训练，可以输入序列，将其转化为对应的输出序列，知识是通过神经网络训练得到的。在训练过程中，ChatGPT使用了海量的自然语言文本数据来学习单词的嵌入表示，以及上下文之间的关系，这些知识被编码在神经网络的参数中，输出的结果都生成于这些参数之中。收到用户的问题时，ChatGPT会将其输入到神经网络中，神经网络会根据它学到的知识回答问题，反馈给用户。超强的记忆力是它的重要特征。ChatGPT作为一个现象级的技术产品，在生成内容方面无疑是革命性的，代表着人工智能大模型加大数据范式方法的成功，也说明采用统计模型方法模拟人类语言智能的新发展。ChatGPT在大模型的基础上，采用人类反馈强化学习的训练机制和提示引导模式，促使模型逐渐顺应人类思考逻辑，趋向人类认知和习惯，这是它的一大创新。

　　三、对未来语言智能走向的影响

　　ChatGPT除了对人类生活带来影响，对语言智能领域的研究范式和发展走向也会带来巨大的冲击。从大量的语言数据中学习，挖掘语言规律和语义关系，极大地改进了自然语言理解和生成的质量，取得惊喜的使用效果，使我们对大语言模型有了新的认知和思考：大模型范式是否成为未来语言智能的主流技术？学术界和企业界从事多年的自然语言处理研究还需要继续搞下去吗？ChatGPT会给AI领域的研究带来怎样的影响？

　　预训练模型的出现代表了自然语言处理技术的飞跃，减少了对特征工程的依赖，逐渐带动整个领域研究范式的转变。这种范式转变带来的影响主要体现在：

　　一是自然语言处理研究子领域的逐渐弱化，例如词性标注、命名实体识别、句法分析、指代消解等问题，它们在大模型+大数据独领风骚的背景下，将会逐渐失去吸引力，甚至被淡忘和遗弃。

　　二是自然语言处理不同子领域的技术方法和技术框架日趋统一。多少年来，为了让机器理解人类语言，人们想尽各种方法来标注词性，理解语义。ChatGPT的出现，让人们看到了语言预训练模型威力，通过这种范式处理自然语言效果会更好。

　　第三，从全球语言智能的发展来看，大模型范式的一路领航势必导致技术、资源、用户的高度趋合，最终走向技术和资源的单极垄断。

　　四、未来发展

　　尽管ChatGPT在智能交互方面获得惊人的能力，但它毕竟是一个预训练语言模型，基于预存知识和模型回答问题，并不具备真正的理解能力和创造能力，不能理解自己输出的内容。面对语言智能的新发展和新挑战，未来可以着重考虑以下几个着力点。

　　（一）深度学习模型的优化。结合人类语言习得，语言使用规律和习惯，推进深度学习模型研究，提高语义理解能力，更好模拟人类语言能力。

　　（二）多模态语言理解与生成。随着多模态数据的不断增加，如何在多模态语言理解任务中有效融合多种信息来源，提高语言理解的准确性是当前语言智能研究的一个重要方向。ChatGPT主要是文本的自动生成，多模态的语言理解和生成问题尚未完全解决。需要未来深入研究多模态学习和多模态生成技术。

　　（三）领域知识图谱的构建。虽然ChatGPT可以搜索众多信息，对一般问题回答较好，但相对有深度和专业性较强的问题却表现得力不从心。如何更好地利用知识图谱的语义信息，提高自然语言处理任务的准确性，更好地服务于各类专业性用户，也是未来可以发展的一个领域。

　　（四）加强人工智能伦理和数据安全等问题的研究。ChatGPT是生成型人工智能，不是简单地分析和处理数据，很可能会引发道德和法律方面的违规行为。比如，对信息数据来源无法进行事实核查，存在个人数据和商业秘密泄露，或提供虚假信息的隐患。学生使用ChatGPT写论文是否算抄袭等等，因此加强科技伦理研究，建立数据安全法规的约束机制，增强人们对技术变革的现代智慧是非常迫切的任务。

　　作者：李佐文，系北京外国语大学人工智能与人类语言重点实验室教授、博士生导师

[ 责编：蔡琳 ]

阅读剩余全文（）

您此时的心情

新闻表情排行日/周

开心

0
难过

0
点赞

0
飘过

0

视觉焦点

探访北京市平谷区体育中心安置点
延安南泥湾：陕北好江南再焕新颜

最热文章

推荐阅读

创新创业重构产业发展“新图谱”

科技浪潮下，侨界青年索华也带来创业项目——基于燃气低碳催化的粉末喷涂线研发和产业化，顺应新能源与“双碳”目标趋势。

2025-07-30 09:41

蔬果产量世界首位，何以实现？

中国国土南北跨越纬度近50度、东西跨经度60多度，带来气候多样性，适宜不同品种的蔬菜、水果生长。答：“十四五”以来，在消费升级与供应链创新的双重作用下，我国果蔬产业发生着诸多变化。

2025-07-30 09:40

【光明时评】推动人工智能科技创新与产业创新深度融合

面对激荡的国际竞争局势与高质量发展的迫切需求，唯有主动拥抱变革，让人工智能科技创新的“源头活水”充分浇灌产业创新的“广阔田野”，方能赢得战略主动、制胜未来。

2025-07-30 05:00

千年农耕智慧，焕发时代新光

前不久，甘肃皋兰什川古梨园系统、浙江德清淡水珍珠复合养殖系统和福建福鼎白茶文化系统正式被联合国粮农组织认定为全球重要农业文化遗产。至此，我国的全球重要农业文化遗产数量增至25项，继续领跑全球。

2025-07-30 05:00

双曲线一号遥十运载火箭发射成功

29日12时11分，双曲线一号遥十运载火箭在我国酒泉卫星发射中心发射升空，将搭载的恩施硒都山泉号卫星顺利送入预定轨道，飞行试验任务获得圆满成功。

2025-07-30 05:00

我国成功发射卫星互联网低轨卫星

北京时间7月27日18时03分，我国在太原卫星发射中心使用长征六号改运载火箭，成功将卫星互联网低轨05组卫星发射升空，卫星顺利进入预定轨道，发射任务获得圆满成功。

2025-07-29 10:17

科学家揭示影响鸟撞事故的关键因素

鸟类因误判透明或反光的玻璃而撞击建筑物，被称为“鸟撞”，是威胁鸟类种群的重要因素之一。

2025-07-29 04:40

江西发现蜘蛛新物种广丰合跳蛛

日前从江西铜钹山国家级自然保护区获悉，该自然保护区与井冈山大学蜘蛛生物学研究团队开展蜘蛛资源本底调查中发现蜘蛛新物种——广丰合跳蛛。研究成果在国际期刊《生物钥匙》上发表。

2025-07-29 04:40

重庆发现近危物种长叶山兰

近日，该中心与重庆师范大学生命科学学院唐安军教授团队，在巫溪县白果林场发现近危物种长叶山兰，这是在阴条岭发现的又一新纪录种。

2025-07-29 04:40

用好健康数据乐享健康生活

随着大数据和人工智能技术的发展，数字化健康管理成为一种新的生活风尚，帮助人们提高健康管理的效率和质量。但当人们对健康数据的关注逐渐演变为时刻紧盯、过度解读时，这一数字化工具，反而可能催生不必要的焦虑，让人们在不知不觉中被数据所“绑架”。

2025-07-29 04:40

人形机器人化身“职业技能高手”：在世界人工智能大会洞见生产力变革

上海开普勒机器人有限公司专注于将人形机器人应用于智能制造、仓储物流、智慧巡检等工业场景，以满足实际生产需求。展望未来，人形机器人将提高生产力，与人类高效合作，可能为许多行业带来革命性变革，创造新的价值定位和商业模式。

2025-07-28 09:28

机“慧”共生人形机器人在2025世界人工智能大会展现澎湃动力

智元机器人联合创始人、首席技术官彭志辉就带着机器人进行了一场别开生面的“人机对话”，展望了具身智能时代的人机关系。

2025-07-28 09:28

从“月壤砖”到“月球房”，还需这三步

在产品研制阶段，科研人员重点针对能量高效汇聚—传输、月壤致密化输运等问题，开展了关键技术攻关。

2025-07-28 09:27

2025年江源科考启动持续追踪“中华水塔”保护现状

当日下午抵达位于青海省境内的长江源区通天河直门达河段，进行了多学科采样观测，这意味着2025年江源综合科考正式启动。

2025-07-28 09:25

首张小麦抗条锈病基因图谱绘制成功

研究团队历时5年，通过对近4.7万份田间数据的深度挖掘，构建了涵盖2191份全球小麦种质的“综合抗源”核心资源库。以此为基础，团队首次绘制出覆盖431个遗传位点的小麦基因组抗条锈病基因全景图，清晰展现出抗性基因在全球麦区的时空分布特征。

2025-07-29 04:40

中国对全球科研人才释放“磁吸力”

英国《自然》周刊网站指出，招募研究人员和高技能人才是中国推动经济社会发展和实现科技自立自强的核心。经济合作与发展组织3月发布的报告显示，2023年中国研发投入已超过7800亿美元，达到美国96%的水平，10年前这一比例为72%。

2025-07-28 09:24

人工智能技术让美好生活加速“智”变

艾玛口中的“邦邦车”，是一台由中国企业邦邦机器人独立生产研发的智能辅助出行机器人。爬坡、颠簸路况行进、刹车制动……走进位于江苏省常州市天宁区的邦邦机器人研发中心，不少新产品正在进行多环节测试。

2025-07-28 09:24

高质量科技供给激活发展动能

盛夏时节，数千名科技精英正在浙江湖州西塞科学谷潜心攻关。作为湖州“五谷丰登”计划的首个“创谷”项目，西塞科学谷开园3年来累计引进省内外科技团队近40个、汇聚科技人才2600余名，成功入选全国首批“科创中国”创新基地。

2025-07-25 10:05

人形机器人实现自主换电

一台银灰色人形机器人在汽车生产车间内沉稳行进。2024年，深圳机器人产业集群企业数量达74032家，机器人上市企业34家、独角兽企业9家。

2025-07-25 10:05

“新舟”60民用搜救机完成首飞

24日中午12时许，“新舟”60民用搜救机顺利起飞，经过1小时20分飞行并完成预定验证科目后，平稳降落在西安阎良机场，顺利完成首次飞行。

2025-07-25 10:01

加载更多

全部导航

语言智能的新发展与新挑战

相关阅读

您此时的心情

视觉焦点

最热文章

独家策划