点击右上角
微信好友
朋友圈

请使用浏览器分享功能进行分享

6月23日,中国科学院数据期刊建设工作推进会现场,一本崭新的英文期刊《数据快报(英文)》(DataExpress)正式创刊发布。
由中国科学院牵头打造的“1本旗舰刊+19本领域专业刊”完整数据期刊集群同步亮相,标志着我国科学数据出版事业实现从单刊探索到集群化、国际化布局的历史性跨越,为全球开放科学体系注入中国自主平台力量。
“存得下来,但发不出去”的困局
当下,全球科技创新正迈入数据密集型科研与AIforScience双轮驱动的全新阶段。历经经验、实验、理论、数据密集型四大科研范式演进,叠加人工智能技术颠覆性突破,科学数据早已从科研附属副产品,跃升为与传统学术论文同等重要,甚至更具基础价值的战略创新资源。
但长期以来,我国科研界面临一个尴尬的现实:大科学装置、国家野外台站、重大科技项目积累了海量优质数据,但这些数据大多“沉睡”在实验室中。正如DataExpress主编、中国科学院院士于贵瑞所言:“很多优质科学数据存得下来,但发不出去;发得出去,但影响力不够。”
数据论文正是破解这一困局的有力措施。它详细记录数据采集方案、加工流程、质量控制标准,使数据成为“独立可溯源、可引用的学术产出”。于贵瑞说:“学术论文发表的是基于数据演绎出的科学结果与认知,而数据论文发布的是支撑研究过程的原始数据本身。两者是一个完整科研活动的不同成果。”
AI时代的数据竞赛
DataExpress的创刊,还有一层更为紧迫的时代背景。
“未来的人工智能竞争,本质上是数据资源的竞争。”于贵瑞强调。当前,AIforScience浪潮席卷全球,大模型的科学发现能力高度依赖高质量、可计算、可复用的“AI-Ready”数据。没有高质量数据,再先进的算法也无法产生高水平科学发现。
这正是DataExpress的独特定位——“快报”。其核心使命是将准确、可信的数据信息快速传递到科学家手中,使数据快速转化为数字资源。在这个意义上,数据期刊不仅是单纯的学术出版物,更是支撑AI驱动科学发现的新型基础设施。
“今天,我们正站在科学研究范式变革的历史关口,以往的‘论文或论著’时代正在走向‘论文或论著’与‘数据论文或产品’并行的新时代。”于贵瑞在创刊主旨发言中作出判断。
从“单刊探索”到“集群引领”
DataExpress并非孤军奋战。中国科学院同步启动了DataExpress引领的“1种综合旗舰刊+19种领域专业刊”数据期刊集群建设,覆盖数理、生态环境、海洋大气、生命健康、现代农业等重点领域。这一布局标志着中国科学院数据期刊建设实现了从“单刊探索”到“集群引领”、从“国内率先探索”到“国际协同引领”的重要跃升。
背后是一整套数字学术基础设施的支撑。据介绍,中国科学院依托科技期刊全流程数字出版与知识服务平台SciEngine、论文关联科学数据仓储平台ScienceDB、中国科技资源标识系统CSTR以及科学数据预印本平台DarXiv,形成了覆盖数据存储、标识注册、数据出版、国际传播、学术评价的完整出版链路。
其中,ScienceDB是我国唯一获国际主要出版商广泛推荐和国际主流学术索引平台收录的通用存储库,也是唯一获国家新闻出版署、中宣部、中国科协等部委推荐的自主论文关联数据存储平台,其可信服务能力获得众多国际学者及国际组织高度评价,并被联合国教科文组织收录为全球开放科学优秀实践案例。
在标准规范层面,中国科学院牵头完成了《科学数据引用》(GB/T35294-2017)、《数据论文出版元数据》(GB/T42813-2023)、《信息与文献编写规则第4部分:数据论文》(GB/T7713.4-2025)等国家标准的研制工作,系统梳理数据出版各环节的标准空白,为构建规范统一、兼容开放的数据出版体系提供了有力支撑。
让数据论文成为连接世界的新语言
中国科学院计算机网络信息中心党委书记孙德刚在致辞中指出,在大数据和人工智能时代,科学数据已成为国家战略性基础资源,数据期刊是鼓励科学数据开放共享、完善科学数据治理体系、赋能新范式科研的关键抓手,对于汇聚高质量数据资源、规范数据存证共享、释放数据创新动能、提升我国在科学数据领域的国际话语权具有重要意义。
谈及期刊使命,于贵瑞介绍说,一是打造国家级数据成果发布阵地,聚焦大科学装置、长期野外观测、跨学科重大科研数据集,让国家级优质数据拥有自主权威国际发布渠道;二是培育AI科研高质量数据供给源,将原始观测数据标准化加工为机器可读取、可直接训练大模型的AI-Ready数据集,夯实AIforScience底层资源底座;三是搭建全球开放科学协同枢纽,打破传统期刊仅传播科研结论的局限,完整记录实验方案、质控标准、原始观测素材,搭建“数据生产者—出版平台—全球使用者”良性循环生态。
“如果说过去一个世纪,论文记录了人类科学发现的历史;那么未来一个世纪,人类将会用数据和论文共同记录科学史。”于贵瑞在创刊发布会上展望说,我们希望通过DataExpress的建设,让每一份高价值科学数据都能够被发现、被共享、被引用、被传承。让数据论文成为连接科学家、连接学科、连接世界的新语言和新载体。(记者 宋雅娟)
