点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:2022语言与智能技术竞赛收官 深度探索NLP技术路线和应用新场景
首页> 科技频道> 综合新闻 > 正文

2022语言与智能技术竞赛收官 深度探索NLP技术路线和应用新场景

来源:光明网2022-09-21 16:29

  9月18日,由中国中文信息学会(CIPS)和中国计算机学会(CCF)共同发起并联合主办的第七届语言与智能高峰论坛召开。论坛上,2022语言与智能技术竞赛赛事组委会为各获奖团队颁奖,赛事各冠军团队就参赛技术方案作详细报告。

  语言与智能技术竞赛由中国中文信息学会和中国计算机学会联合主办,百度、中国中文信息学会评测工作委员会和中国计算机学会自然语言处理专委会承办。自2018年举办以来,凭借面向真实应用场景的任务设计和源自真实场景的数据集,该竞赛已成为全球最权威、最热门的中文NLP赛事之一。2022届竞赛进一步升级,联合“千言”数据集开源项目,设置了段落检索、知识对话、情感可解释、视频语义理解四大任务,覆盖了跨模态、知识驱动、可信学习等前沿课题,具有较高的学术和产业价值。

  赛题任务的全面升级受到学术界与产业界的广泛关注。据统计,本届竞赛共计约2500支团队报名,参赛选手覆盖全球262所高校和208家企业,提交有效结果超过7000份。其中,高校选手占比约52%,来自清华大学、北京大学、复旦大学、中国人民大学、中国科学院大学、伊利诺伊理工大学、悉尼大学等国内外知名高校;企业选手占比约34%,来自中国移动、联通、平安保险、华为、腾讯、网易、小米、小鹏汽车、海康威视、施耐德电气等知名企业,覆盖了金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。经过激烈的竞争,最终来自中国科学技术大学、香港中文大学、阿里巴巴、腾讯、商汤科技等高校与企业的共计16支团队获奖。

  赛事优胜团队在参赛方案中均使用了预训练语言模型,也提出了很多创新思路和方案,并取得了大幅的效果提升。相较于赛事官方的基线成绩,段落检索任务提升了15.40%,知识对话任务提升了142.86%,情感可解释任务提升了77.12%,视频语义理解任务提升了50%,各团队的技术方案有力地推动了相关任务的技术探索。在论坛的评测报告环节,四大任务的冠军团队对各自的参赛方案做了分享。

  在段落检索任务中,来自中国科学技术大学的“young的团队”提出了一种基于弱监督数据预训练的开放问答段落检索方法,该方法可以有效提升检索准确率。在知识对话赛题中,来自腾讯的“拿件T恤就溜”团队,设计了一个基于实时知识搜索API的知识对话系统,实验表明该方案可以显著提升对话整体的连贯性和吸引力。在情感可解释任务中,阿里巴巴的“Ali_农民工团队” 提出了一个基于通用信息抽取统一框架 UIE的情感可解释分析方法,该方法根据情感可解释任务的特点,使用few-shot、文本聚类等方法,提高了模型的合理性、忠诚性。在视频语义理解任务中,来自商汤科技&香港科技大学的“商汤NLP×LaVi的团队”针对分类标签预测任务和语义标签预测任务,分别设计了对应方案,提出了基于多模态学习的视频语义理解模型,并通过数据增强、数据加权和多模型集成进一步提升方案性能,最终脱颖而出。

  针对此次竞赛,百度自然语言处理部主任架构师刘璟表示,“四大任务的优胜方案相对基线均大幅提升。各优胜队伍均基于预训练模型进行了一系列的创新,如采用prompting技术、面向任务的预训练等,有效地推动了技术的进步。目前来看,知识融合、可信学习、跨模态等技术在应用落地中还存在很多挑战,未来需要更大地突破。”

  值得一提的是,本次竞赛数据集均来自于千言中文开源数据集项目。千言是面向自然语言处理的中文开源数据共建项目,由中国计算机学会、中国中文信息学会和百度联合发起,目前已有近20家单位的数据集作者参与共建,已有覆盖文本生成、情感分析、阅读理解等15个任务方向的近60个中文NLP开源数据集入驻。

  2022语言与智能竞赛发布了首个来自搜索引擎的大规模中文段落检索数据集DuReader_retrieval、首个服务信息增强对话数据集DuSinc、首个细粒度中文情感可解释评测数据集DuExplain、视频语义理解数据集DuVideoTag。赛后,开发者可继续在千言数据集官网下载使用以上数据集,并参与相应的榜单评测,不断提升技术水平,实现创新发展。

  语言是人类信息传递最重要的媒介,近年来自然语言处理领域获得了产学研各界的持续关注。语言与智能技术竞赛将继续提供面向真实应用场景的数据集和富有挑战性的任务设定,引领学术研究面向真实应用,提升语言理解与人机交互智能水平,为推动语言与智能领域技术发展和应用贡献力量。(柯岩)

[ 责编:姜楠 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 百年接力,守护城市万亩林海

  • 山东:“渔光融合”共享海洋绿色资源

独家策划

推荐阅读
2025全球数字经济大会2日在北京开幕。除收录标准的优势外,东壁全球科技文献数据平台还根据中国科技界与教育界的习惯,对所收录期刊进行了学科分类。
2025-07-04 09:55
超材料是一类具有特殊性质的人造材料,而具有热辐射性能的超材料可以把多余的热量“打包”传递到外界,热辐射超材料可广泛应用于零能耗辐射冷却、建筑节能降温、航天热控等诸多重要领域。
2025-07-04 09:53
中国科学院院士、海南大学生物医学工程学院教授骆清铭团队成功绘制出了小鼠三维脑区和立体定位图谱
2025-07-04 09:52
7月4日,神秘的水星将迎来东大距,这是今年第二次水星东大距,观测条件依然不错。
2025-07-04 09:51
科学是生产力的核心要素。
2025-07-04 09:50
钙钛矿太阳能电池因成本低、效率高、易加工等优势备受关注,可应用于光伏发电、车载光伏、光伏建筑等领域。
2025-07-03 09:59
目前,对于10厘米以上大型空间碎片,航天器通常采用主动规避的策略,通过轨道调整,避开可能的碰撞路径。
2025-07-03 09:58
6月26日,中国民航局官网发布公告,提到为切实保障航空运行安全,自2025年6月28日起,禁止旅客携带没有3C标识、3C标识不清晰、被召回型号或批次的充电宝乘坐境内航班。
2025-07-03 09:56
药膳制作师既要懂烹饪,是餐厅的大厨,又要懂中医药理论知识,特别是能够作为食药物质的中药材。
2025-07-03 09:55
运动有助于健康和抗衰老。但究竟是什么让运动有这种奇效呢?我国研究团队历时6年,首次系统解析了人体对急性单次运动与长期规律运动的分子-细胞动态响应谱,揭示肾脏是运动效应的关键应答器官——其内源代谢物甜菜碱作为衰老延缓的核心分子信使,通过靶向抑制天然免疫枢纽激酶TBK1,协同阻遏炎症并缓解多器官衰老进程。
2025-07-03 05:20
近日,四川乐山一小伙感觉身体不适独自乘出租车前往医院就诊,途中开启“超强自救”模式:联系妈妈告知情况、打110报警求助、打120告知医院准备急救。如果长期处于焦虑引起的躯体化障碍状态,患者会反复出现头痛、心慌、呼吸急促、胃肠紊乱、肢体疼痛、睡眠问题等。
2025-07-02 10:06
使用人工智能大模型时,不少人或许都遇到过类似问题:它们有时会捏造细节,甚至“一本正经地胡说八道”。当“喂给”大模型的训练数据包含虚假信息时,它就会产生“幻觉”、给出错误答案。
2025-07-02 10:05
中国国际航空公司所属的国产C909客机平稳降落在蒙古国乌兰巴托成吉思汗国际机场,标志着国航首条C909国际航线正式开通。早8时许,这架C909客机从呼和浩特起飞,经过1个多小时飞行抵达乌兰巴托。
2025-07-02 10:03
农业是国民经济的基础,农业领域形成新质生产力是国民经济形成和发展新质生产力的基础和“底盘”。 农业新质生产力是通过提升劳动者素质、优化劳动资料和创新利用劳动对象,实现全要素生产率的显著提高。
2025-07-02 10:01
团队基于卫星遥感数据构建了1988年至2021年青藏高原30米分辨率人工草地数据集,明确了青藏高原主要的人工草地类型及其时空分布特征,并揭示了青藏高原人工草地的迅速扩张及其驱动机制。
2025-07-02 09:59
屠光绍认为,金融机构在应用人工智能时必须在服务投资人与消费者之间寻求平衡,避免AI鸿沟,坚守金融服务大众的初心。鲍建敏倡导构建产学研深度融合、开放共赢的人工智能金融生态体系,搭建跨机构、跨领域的协同创新平台。
2025-07-01 10:13
6月30日,2025温布尔登网球锦标赛在英国伦敦拉开大幕,引发球迷关注。在草地球场,球的速度更快且弹跳不规则,比赛回合较短,发球就成为球员们的重要“武器”。红土球场并不是天然土壤,而是分层分布着碎砖粉、白色碎石灰石、碎石等。
2025-07-01 10:09
7月1日起,医保定点医药机构在销售药品时,必须按要求扫药品追溯码后方可进行医保基金结算;2026年1月1日起,所有医药机构都要实现药品追溯码全量采集上传。步,进入国家医保局微信公众号主页,点击服务、药品追溯信息查询,进入查询页面;或进入国家医保局微信公众号消息对话页,点击医保服务、药品追溯信息查询,进入查询页面。
2025-07-01 10:09
记者从国家航天局获悉,7月1日,该局发布行星探测工程天问二号探测器在轨获取的地月影像图。(国家航天局供图)  月球全色图,由天问二号探测器的窄视场导航敏感器于2025年5月30日15时拍摄,经辐射校正处理后制作而成。
2025-07-01 10:08
龙芯中科近日正式发布基于国产自主指令集龙架构研发的服务器处理器龙芯3C6000系列芯片、工控领域及移动终端处理器龙芯2K3000/3B6000M芯片以及相关整机和解决方案。
2025-07-01 10:06
加载更多