点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:2022语言与智能技术竞赛收官 深度探索NLP技术路线和应用新场景
首页> 科技频道> 综合新闻 > 正文

2022语言与智能技术竞赛收官 深度探索NLP技术路线和应用新场景

来源:光明网2022-09-21 16:29

  9月18日,由中国中文信息学会(CIPS)和中国计算机学会(CCF)共同发起并联合主办的第七届语言与智能高峰论坛召开。论坛上,2022语言与智能技术竞赛赛事组委会为各获奖团队颁奖,赛事各冠军团队就参赛技术方案作详细报告。

  语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办。自2018年举办以来,凭借面向真实应用场景的任务设计和源自真实场景的数据集,该竞赛已成为全球最权威、最热门的中文NLP赛事之一。2022届竞赛进一步升级,联合“千言”数据集开源项目,设置了段落检索、知识对话、情感可解释、视频语义理解四大任务,覆盖了跨模态、知识驱动、可信学习等前沿课题,具有较高的学术和产业价值。

  赛题任务的全面升级受到学术界与产业界的广泛关注。据统计,本届竞赛共计约2500支团队报名,参赛选手覆盖全球262所高校和208家企业,提交有效结果超过7000份。其中,高校选手占比约52%,来自清华大学、北京大学、复旦大学、中国人民大学、中国科学院大学、伊利诺伊理工大学、悉尼大学等国内外知名高校;企业选手占比约34%,来自中国移动、联通、平安保险、华为、腾讯、网易、小米、小鹏汽车、海康威视、施耐德电气等知名企业,覆盖了金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。经过激烈的竞争,最终来自中国科学技术大学、香港中文大学、阿里巴巴、腾讯、商汤科技等高校与企业的共计16支团队获奖。

  赛事优胜团队在参赛方案中均使用了预训练语言模型,也提出了很多创新思路和方案,并取得了大幅的效果提升。相较于赛事官方的基线成绩,段落检索任务提升了15.40%,知识对话任务提升了142.86%,情感可解释任务提升了77.12%,视频语义理解任务提升了50%,各团队的技术方案有力地推动了相关任务的技术探索。在论坛的评测报告环节,四大任务的冠军团队对各自的参赛方案做了分享。

  在段落检索任务中,来自中国科学技术大学的“young的团队”提出了一种基于弱监督数据预训练的开放问答段落检索方法,该方法可以有效提升检索准确率。在知识对话赛题中,来自腾讯的“拿件T恤就溜”团队,设计了一个基于实时知识搜索API的知识对话系统,实验表明该方案可以显著提升对话整体的连贯性和吸引力。在情感可解释任务中,阿里巴巴的“Ali_农民工团队” 提出了一个基于通用信息抽取统一框架 UIE的情感可解释分析方法,该方法根据情感可解释任务的特点,使用few-shot、文本聚类等方法,提高了模型的合理性、忠诚性。在视频语义理解任务中,来自商汤科技&香港科技大学的“商汤NLP×LaVi的团队”针对分类标签预测任务和语义标签预测任务,分别设计了对应方案,提出了基于多模态学习的视频语义理解模型,并通过数据增强、数据加权和多模型集成进一步提升方案性能,最终脱颖而出。

  针对此次竞赛,百度自然语言处理部主任架构师刘璟表示,“四大任务的优胜方案相对基线均大幅提升。各优胜队伍均基于预训练模型进行了一系列的创新,如采用prompting技术、面向任务的预训练等,有效地推动了技术的进步。目前来看,知识融合、可信学习、跨模态等技术在应用落地中还存在很多挑战,未来需要更大地突破。”

  值得一提的是,本次竞赛数据集均来自于千言中文开源数据集项目。千言是面向自然语言处理的中文开源数据共建项目,由中国计算机学会、中国中文信息学会和百度联合发起,目前已有近20家单位的数据集作者参与共建,已有覆盖文本生成、情感分析、阅读理解等15个任务方向的近60个中文NLP开源数据集入驻。

  2022语言与智能竞赛发布了首个来自搜索引擎的大规模中文段落检索数据集DuReader_retrieval、首个服务信息增强对话数据集DuSinc、首个细粒度中文情感可解释评测数据集DuExplain、视频语义理解数据集DuVideoTag。赛后,开发者可继续在千言数据集官网下载使用以上数据集,并参与相应的榜单评测,不断提升技术水平,实现创新发展。

  语言是人类信息传递最重要的媒介,近年来自然语言处理领域获得了产学研各界的持续关注。语言与智能技术竞赛将继续提供面向真实应用场景的数据集和富有挑战性的任务设定,引领学术研究面向真实应用,提升语言理解与人机交互智能水平,为推动语言与智能领域技术发展和应用贡献力量。(柯岩)

[ 责编:姜楠 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 新春走基层丨广东普宁:英歌起舞闹新春

  • 新春“村游”乐

独家策划

推荐阅读
春节期间,记者来到异龙湖,听到了当地群众对共建生态文明、共享生态成果的感受。
2026-02-21 12:46
莱州中华武校第十次登上央视春晚舞台
2026-02-17 10:21
近日,一个名为Moltbook的社交平台突然走红。与普通网络平台不同的是,Moltbook上的用户都是AI智能体。
2026-02-14 09:21
全球规模最大的200万吨/年柴油吸附分离装置目前在中国石油广西石化稳定运行。
2026-02-14 09:16
大连理工大学赵珺教授带领师生团队正抓紧时间,为实现可重复使用运载火箭关键部件的“复用检测”技术突破全力冲刺。
2026-02-14 09:12
一场刷新人类对宇宙极端物理过程认知的高能事件,被中国科学卫星清晰捕获并成功解读。
2026-02-14 09:11
近日,中国计量科学研究院研制的锶原子光晶格钟NIM-Sr1正式获准校准国际标准时间,实现了我国光钟参与校准国际标准时间“零”的突破。
2026-02-14 09:10
装上智能仿生手,截肢患者可以轻松拿起水杯喝水;高位截瘫患者用意念移动电脑光标,操控轮椅,指挥机器狗取外卖……
2026-02-13 09:50
凌晨2时,南昌西动车组运用一所检修库内灯光如昼。“接触网已断电,安全措施准备完毕,申请登顶!”确认许可后,国铁南昌局电务段南昌西车载设备车间工长曹准与工友一前一后登上动车组车顶,对北斗天线进行全面“体检”。
2026-02-13 09:45
近日,广西涠洲岛海域发生渔船撞击布氏鲸事件,鲸鱼受伤的画面令人揪心。虽然撞鲸的并非观鲸船,但这起事件也给正处于旺季的观鲸游敲响警钟——负责任地观鲸,有边界地亲近,人与自然和谐共生图景才能真正长久。
2026-02-13 09:43
核光钟通过真空紫外激光诱导原子核跃迁,具备更高精度与强抗干扰能力,且可实现便携化应用。但研制核光钟的道路上的一个核心瓶颈,是无法研制出能激发核跃迁的连续波激光光源。
2026-02-13 09:42
2021年,王勤团队开始研发低成本、适用于牧场环境的马匹体形自动测定设备。王勤团队搜集了全球90个马群体、近40个品种的基因组信息,构建了包含2000多个个体的参考面板——这是目前全球规模最大的马基因组参考数据库。
2026-02-13 09:36
一纸锦旗山水间,杏林春暖绿意长。
2026-02-12 11:01
金星与地球大小相近,同样诞生于太阳系内侧,却有着截然不同的命运。
2026-02-12 09:41
科技部十司相关负责同志解读《调查处理规定》。
2026-02-12 09:38
《细胞》封面:猕猴屏状核细胞分类与全脑联接图谱。在当前脑图谱大科学计划研究目标迈进绘制非人灵长类介观脑图谱的关键阶段,中国科学家仍在进一步集聚全球力量,持续扩大“朋友圈”。
2026-02-12 09:25
据悉,在战略上,植物星球计划还将整体提升全球生物多样性保护和实现碳中和的生态能力,构建植物科学领域全球大科学命题国际合作的新格局。
2026-02-12 09:17
马年将至,作为一种兼具力量与速度的动物,马正受到格外的关注。
2026-02-12 09:12
工业和信息化部等五部门近日印发《关于加强信息通信业能力建设支撑低空基础设施发展的实施意见》。加强监管能力体系建设,规划无人机专用号段,推动“一机一码一号”能力建设,探索标识解析在无人机领域的应用,形成无人机通信资源精细化管理。
2026-02-11 09:25
全球森林逐渐被快生树木主导,而稳定生态系统的慢生树种正在消失。“我们关注的是极为独特的物种,它们主要集中在生物多样性丰富、生态系统联系紧密的热带和亚热带地区。“此外,在现在和未来受到干扰的地区,非本地物种可能会加剧对光、水和养分的竞争,从而使本地树木更难生存。
2026-02-11 09:32
加载更多