点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:2022语言与智能技术竞赛收官 深度探索NLP技术路线和应用新场景
首页> 科技频道> 综合新闻 > 正文

2022语言与智能技术竞赛收官 深度探索NLP技术路线和应用新场景

来源:光明网2022-09-21 16:29

  9月18日,由中国中文信息学会(CIPS)和中国计算机学会(CCF)共同发起并联合主办的第七届语言与智能高峰论坛召开。论坛上,2022语言与智能技术竞赛赛事组委会为各获奖团队颁奖,赛事各冠军团队就参赛技术方案作详细报告。

  语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办。自2018年举办以来,凭借面向真实应用场景的任务设计和源自真实场景的数据集,该竞赛已成为全球最权威、最热门的中文NLP赛事之一。2022届竞赛进一步升级,联合“千言”数据集开源项目,设置了段落检索、知识对话、情感可解释、视频语义理解四大任务,覆盖了跨模态、知识驱动、可信学习等前沿课题,具有较高的学术和产业价值。

  赛题任务的全面升级受到学术界与产业界的广泛关注。据统计,本届竞赛共计约2500支团队报名,参赛选手覆盖全球262所高校和208家企业,提交有效结果超过7000份。其中,高校选手占比约52%,来自清华大学、北京大学、复旦大学、中国人民大学、中国科学院大学、伊利诺伊理工大学、悉尼大学等国内外知名高校;企业选手占比约34%,来自中国移动、联通、平安保险、华为、腾讯、网易、小米、小鹏汽车、海康威视、施耐德电气等知名企业,覆盖了金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。经过激烈的竞争,最终来自中国科学技术大学、香港中文大学、阿里巴巴、腾讯、商汤科技等高校与企业的共计16支团队获奖。

  赛事优胜团队在参赛方案中均使用了预训练语言模型,也提出了很多创新思路和方案,并取得了大幅的效果提升。相较于赛事官方的基线成绩,段落检索任务提升了15.40%,知识对话任务提升了142.86%,情感可解释任务提升了77.12%,视频语义理解任务提升了50%,各团队的技术方案有力地推动了相关任务的技术探索。在论坛的评测报告环节,四大任务的冠军团队对各自的参赛方案做了分享。

  在段落检索任务中,来自中国科学技术大学的“young的团队”提出了一种基于弱监督数据预训练的开放问答段落检索方法,该方法可以有效提升检索准确率。在知识对话赛题中,来自腾讯的“拿件T恤就溜”团队,设计了一个基于实时知识搜索API的知识对话系统,实验表明该方案可以显著提升对话整体的连贯性和吸引力。在情感可解释任务中,阿里巴巴的“Ali_农民工团队” 提出了一个基于通用信息抽取统一框架 UIE的情感可解释分析方法,该方法根据情感可解释任务的特点,使用few-shot、文本聚类等方法,提高了模型的合理性、忠诚性。在视频语义理解任务中,来自商汤科技&香港科技大学的“商汤NLP×LaVi的团队”针对分类标签预测任务和语义标签预测任务,分别设计了对应方案,提出了基于多模态学习的视频语义理解模型,并通过数据增强、数据加权和多模型集成进一步提升方案性能,最终脱颖而出。

  针对此次竞赛,百度自然语言处理部主任架构师刘璟表示,“四大任务的优胜方案相对基线均大幅提升。各优胜队伍均基于预训练模型进行了一系列的创新,如采用prompting技术、面向任务的预训练等,有效地推动了技术的进步。目前来看,知识融合、可信学习、跨模态等技术在应用落地中还存在很多挑战,未来需要更大地突破。”

  值得一提的是,本次竞赛数据集均来自于千言中文开源数据集项目。千言是面向自然语言处理的中文开源数据共建项目,由中国计算机学会、中国中文信息学会和百度联合发起,目前已有近20家单位的数据集作者参与共建,已有覆盖文本生成、情感分析、阅读理解等15个任务方向的近60个中文NLP开源数据集入驻。

  2022语言与智能竞赛发布了首个来自搜索引擎的大规模中文段落检索数据集DuReader_retrieval、首个服务信息增强对话数据集DuSinc、首个细粒度中文情感可解释评测数据集DuExplain、视频语义理解数据集DuVideoTag。赛后,开发者可继续在千言数据集官网下载使用以上数据集,并参与相应的榜单评测,不断提升技术水平,实现创新发展。

  语言是人类信息传递最重要的媒介,近年来自然语言处理领域获得了产学研各界的持续关注。语言与智能技术竞赛将继续提供面向真实应用场景的数据集和富有挑战性的任务设定,引领学术研究面向真实应用,提升语言理解与人机交互智能水平,为推动语言与智能领域技术发展和应用贡献力量。(柯岩)

[ 责编:姜楠 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 海南万宁获救海豚“万万”成功回归大海

  • 第二届金熊猫奖在成都揭晓

独家策划

推荐阅读
走进展区,多款新潮文创让人爱不释手;戴上设备,苏轼笔下的诗词世界任人遨游;指尖轻点,三千年前的青铜器“触手可及”……一系列新产品、新服务、新场景在2025年中国国际服务贸易交易会文旅服务专题亮相,漫步其中,处处感受到科技与创意奔涌、文化和旅游融合的无限活力。
2025-09-15 09:54
在2025年中国国际服务贸易交易会上,一批品类丰富、兼具趣味与文化内涵的文创精品成为展会现场的“人气王”,引爆观展热潮。
2025-09-15 09:54
最大网络基础设施的建成有助于我国突破关键技术的“卡脖子”困境,形成自主可控的核心技术优势,建立起数字经济产业的第二创新生态。 (作者:戎 珂,系清华大学社会科学学院经济学研究所所长、长聘教授;田晓轩,系清华大学社会科学学院经济学研究所博士研究生)
2025-09-15 09:53
今年暑期,工厂游火爆出圈。参观名额秒空、门票收入可观、社交平台相关笔记有10多万条,工厂游俨然成了文旅界新宠。 工厂游等新型旅游业态,实现了工业与文旅的跨界融合,也为文旅经济的发展提供了新增长点。
2025-09-15 09:52
深夜,河南焦作多氟多新材料股份有限公司的实验室依旧灯火通明,总工程师闫春生还在带着团队忙碌。 2006年,多氟多打响了由传统氟化工向精细氟化工、新能源材料转型的战役,闫春生临危受命加入六氟磷酸锂研发团队。
2025-09-15 09:51
2025年中国国际服务贸易交易会9月10日至9月14日在北京举办,众多科技产品亮相展区,吸引观众驻足参观。2025年中国国际服务贸易交易会9月10日至9月14日在北京举办,众多科技产品亮相展区,吸引观众驻足参观。
2025-09-12 10:08
汽车排放被认为是气候变化的“元凶”之一,但学术界一直缺乏对城市道路碳排放进行精准刻画的工具。”借助全景AI模型,可实现二氧化碳排放源的精准提取,模型的平均精度超过93%、平均误差低于1.3ppm(ppm为百万分比浓度)。
2025-09-12 10:01
习近平总书记指出:“要把握人工智能发展趋势和规律,加紧制定完善相关法律法规、政策制度、应用规范、伦理准则,构建技术监测、风险预警、应急响应体系,确保人工智能安全、可靠、可控。人工智能系统的可靠性不能停留在统计意义上的“高概率正确”,而应追求在复杂、开放、动态环境下的“高置信可靠”。
2025-09-12 10:01
10日,2025世界顶尖科学家协会奖(以下简称“顶科协奖”)获奖者名单在上海公布。顶科协奖是2021年在上海发起创设、由红杉中国独家提供永久资金支持的面向全球科学家评选的科学大奖。
2025-09-12 09:59
全球规模最大恐龙蛋化石群——湖北十堰青龙山恐龙蛋化石群的埋藏时代,首次被科学家认定为距今约8600万年。专家考证,这是迄今全球分布最集中、规模最大、埋藏最好、原地出露最多、原址保存最好的恐龙蛋化石群。
2025-09-12 09:58
9月10日上午,在马来西亚吉隆坡召开的国际灌排委员会第七十六届国际执行理事会会议上,2025年(第十二批)世界灌溉工程遗产名录正式公布,我国申报的云南元阳哈尼梯田、江苏句容赤山湖灌溉工程、四川彭州湔江堰、北京门头沟永定河古渠灌溉工程全部成功入选。
2025-09-11 10:18
“十四五”以来,我们牢固树立和践行绿水青山就是金山银山的理念,全力当好自然资源“大管家”和美丽中国“守护者”,全面完成了“十四五”规划的目标任务,有效支撑了经济社会的高质量发展。
2025-09-11 09:57
未来,城市的画卷上,AI、物联网与大数据等现代科技将继续深化推广,但唯有始终以人的尺度丈量技术,以人文的关怀驾驭创新,方能使城市永葆文气的深度、人气的热度与烟火气的温度,让每座城市都在科技的守护中,找到生生不息的发展动能。
2025-09-11 09:52
北京大学的科研团队与合作者联合开发出一种全新的“高维超分辨成像”技术,成功实现了对活细胞内15种细胞器的同时成像与精准识别,为细胞生物学研究打开了一扇全新的大门。
2025-09-11 09:43
要为“年纪尚小”的新职业破解“成长的烦恼”,不仅要完善新职业的职业标准和评价规范,还要有能跟上步伐的教育培训和职业培训,为新职业从业者提供支持政策,提升社会保障水平,以更好的保障制度、更强的身份认同感、更完善的培养体系为新职业就业者提供更广阔、更精彩的发展舞台,让他们在与时代“同频共振”的岗位上实现人生价值,也为创新创造的活力涌动持续贡献力量。
2025-09-11 09:39
宋美珍是中国农科院西部农业研究中心的棉花研究专家。2012年起,她和团队将目光瞄准新疆的棉花种植,成为当地棉花研究的一支重要技术力量。
2025-09-10 10:09
“十四五”以来,我国制造业增加值每年均超过30万亿元,总体规模稳居全球制造业首位。这份沉甸甸的成绩单,印证着推动新型工业化取得的新进展新成效。
2025-09-10 09:47
9月9日,2025年中国国际服务贸易交易会开幕前夕,记者跟随首钢媒体探营团,走进北京首钢园,提前探访服贸会的精彩内容。
2025-09-10 09:40
9日10时,我国在文昌航天发射场使用长征七号改运载火箭,成功将遥感四十五号卫星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。
2025-09-10 09:39
光明日报北京9月9日电 记者李春剑从市场监管总局了解到,自2021年全国机器人标委会成立以来,我国已发布机器人领域国家标准126项,另有41项正在研制。近日,世界机器人大会和世界人形机器人运动会火爆“出圈”,相关产业发展引起各方热议。
2025-09-10 09:36
加载更多