点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
【光明时评】
近日,教育部、国家语委、中央网信办共同印发《关于加强数字中文建设 推进语言文字信息化发展的意见》(以下简称《意见》),提出全面推进语言文字信息化发展,以加强数字中文建设为重点,以集成化、智能化、国际化为导向,加强政策引导,优化要素配置,促进协同创新,强化技术赋能,着力提升语言文字服务数字教育、数字科技、数字文化、数字经济、数字社会建设的实际能力。
语言文字“日学而不察、日用而不觉”,广泛存在于社会生产各个方面。随着人工智能时代的到来,语言文字所承担的角色发生深刻转变。它们不再局限于传统的“静态符号”,不再仅仅停留在纸面上供人阅读、书写,而是逐步进化为充满活力与价值的“动态数字资产”,被广泛存储、传输、处理和应用,成为数字世界中不可或缺的构成要素。在此背景下,语言文字信息处理技术的创新与突破,将广泛赋能内容创作、文化传播、信息服务、商业运营等多个领域,有力服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步。
数字中文建设是语言文字事业现代化转型的历史机遇。当前,我国已建成世界最大规模语言资源库和中国语言资源知识图谱,涵盖了海量的文本、语音、词汇等语言数据,为语言文字的分析、处理和应用提供了坚实支撑;发布100多项国家通用语言文字和民族语言文字信息化规范标准,为语言文字的数字化处理提供了统一的规范和依据;建设覆盖190多个国家和地区的全球中文学习平台,利用先进的智能语音识别、语义分析等技术,为全球汉语学习者提供个性化、智能化的语言学习服务,有效提高学习效率;高水平开展普通话水平测试,建设智慧考场,制发电子证书9000多万份,不仅提升了普通话测试的科学性和公正性,也为语言文字的社会应用提供了有力支持。
数字中文建设将有力推动教育信息化。通过大语言模型的研发应用,带动教育教学的革新。在信息化教学场景中,教师可利用大语言模型进行个性化教学,满足不同学生需求,优化教学效果。通过模型分析学生学习数据,也可为教师提供精准教学建议,提升教学质量。借助国家智慧教育公共服务平台和地方智慧教育平台,广泛推广共享语言文字信息化建设成果,使得更多学校和教师能够获取并运用先进的语言文字教学资源,在整体提高全民语言文化素养水平的同时,推动教育资源均衡发展,为偏远地区学校获取优质教学资源拓宽渠道,提升教学质量、促进教育公平。
《意见》明确提出,“到2027年,国家数字中文建设行动取得重要成效,语言文字数据要素价值有效释放”“基本建成国家语言文字大数据中心,初步建成国家关键语料库和国家战略语言资源信息库”。据报道,2015年以来,中国语言资源保护工程对汉语方言和少数民族语言1800多个田野调查点开展调查,范围涵盖近130种语言和地方方言。今年还将启动国家关键领域语料库建设计划,在关键学科、重点行业、战略区域、民生期待和社会急需领域分批建设规范、安全、优质的国家关键语料库。目前,教育部、国家语委已经支持建设了30余项关键领域的语料库。相信随着大数据和深度学习技术的发展,语言自动标注技术将更好反哺基础数据加工和标注,大大提高基础数据和深度信息的制作和标注效率。
数字时代,语言文字作为文化载体和战略资源,将完成向数据要素的重要转型。未来,从鼓励和支持各类社会化语言学习和传播平台的发展,到推动中国语言资源博物馆和地方语言资源博物馆的数字化建设,再到加强古籍数字化整理关键技术研究,数字中文建设将大有可为。
(作者:杨媛媛,系渤海大学文学院副教授)