点击右上角微信好友
朋友圈
请使用浏览器分享功能进行分享
人工智能驱动的科学研究(AI for Science)是加速我国科学研究范式变革和能力提升,提高我国科技创新能力,抢占全球科技制高点的重要支撑。中国工程院院士、之江实验室主任、阿里云创始人王坚认为,人工智能不是一次工具的革命,而是一次科学革命的工具或者是科学革命性的工具。
监测青藏高原水资源,对珊瑚礁进行生态分析,实现自主天文观测……在AI for Science浪潮下,中国科学院多个研究所正通过接入阿里通义千问QwQ-32B推理大模型,开启从“上天”到“入地”,从“观星”到“察水”的科研智能化远征。
精准预测太阳耀斑爆发
耀斑是太阳最剧烈的活动现象之一,每隔约11年就会大爆发。为了破解耀斑爆发之谜,近年来,学者们从数据驱动角度出发,开始用深度学习、机器学习等技术开展研究。然而,随着观测数据的不断积累和数据特征维度的不断增加,对算法规模的要求越来越高,研究人员亟需对海量多模态数据进行有效处理。
大模型的出现带来新解法。在中国科学院国家天文台,科研人员利用QwQ-32B构建的太阳物理大模型“金乌”,对太阳耀斑活动进行精准预测。
国家天文台人工智能小组核心成员李瑀旸对科技日报记者介绍,在阿里通义千问系列模型的基础上,团队通过监督学习、强化学习,训练模型理解、回答太阳物理问题,以及认识、分析太阳图像的能力。其中,太阳耀斑爆发预报任务以SDO(太阳动力学天文台)卫星公开数据、怀柔基地35厘米磁场望远镜数据、“夸父一号”(ASO-S)全日面矢量磁像仪数据为主要数据源进行训练和测试,预测准确率达到领域内前沿水平。
“天文大模型‘星语3.0’则接入国家天文台兴隆观测站望远镜阵列Mini‘司天’,可自主控制观测、分析数据并推荐后续计划。”李瑀旸介绍,“全新升级的‘星语’大模型正在向智能体方向发展,将吸收更多细分领域知识,融合现有科研模型、算法,进一步提升科研效率。”
他还提到,科研对数据安全要求极高,因此,部分科研场景会把模型部署在本地。QwQ-32B可提供相对更低的部署成本,并能满足相关研究对模型能力的要求。
探寻青藏高原“水密码”
青藏高原是“世界屋脊”“亚洲水塔”,也是全球对气候变化响应最敏感的区域之一。第二次青藏科考发现,青藏高原固态水正在快速融化、液态水呈增加趋势。气候变化导致的不确定性,会造成青藏高原潜在的水资源和能源保供风险。
面对这一挑战,中国科学院青藏高原研究所联合阿里云打造了首个专注于气候变化适应领域的水—能—粮多模态推理大模型——“洛书”。
水—能—粮耦合是指水资源、能源系统和粮食生产之间复杂的相互依存和影响关系,研究水—能—粮耦合对制定更有韧性的应对策略至关重要。
中国科学院青藏高原研究所助理研究员夏萃慧介绍,“洛书”以研究所自研的科学模型“思源”为底层,依托青藏高原的时空数据训练而成。其输出结果包含两部分:一部分是直接支撑水电生产预测的径流量,另一部分是精准描绘水文过程的高维数据。“但人类无法直接理解和使用这些数据。‘思源’接入通义千问后,可实现自然语言的查询和输出,实现高维数据可视化呈现,一线人员可据此直接进行决策。”夏萃慧说。
更值得一提的是,“洛书”结合“思源”和QwQ-32B,可直接对数据进行推理分析,得出结论。“比如,在枯水期要观测什么、未来要做哪些工作来适应气候变化等问题,都可以通过推理大模型得到解释,从而辅助决策。”夏萃慧说,在这项研究中,团队还借助阿里云提供的AI计算资源、数据存储和深度学习平台,高效处理海量数据和复杂的计算任务,实现对模型的快速实验和迭代,大幅提升科研效率。
未来,“洛书”还将接入Qwen-VL以实现高效识别图像数据,并与智能体、具身智能观测和空天地一体化动态数据中心相协同,共同为青藏高原生态保护与可持续发展提供科技支撑。
(记者 崔 爽)