全球科研团队竞逐低成本AI模型研发新范式

来源：光明网-《光明日报》2025-02-24 09:20

　　美国斯坦福大学等机构研究团队近日宣布，在基座大模型基础上，仅耗费数十美元就开发出相对成熟的推理模型。尽管其整体性能尚无法比肩美国开放人工智能研究中心（OpenAI）开发的o1、中国深度求索公司的DeepSeek-R1等，但此类尝试意味着企业可以较低成本研发出适合自身的AI应用，AI普惠性有望增强。同时，其所应用的“测试时扩展”技术或代表一条更可持续的AI研发路径。

　　低成本玩转高级推理

　　美国斯坦福大学和华盛顿大学研究团队近日宣布研发出名为s1的模型，在衡量数学和编码能力的测试中，可媲美o1和DeepSeek-R1等。研究团队称，训练租用所需的计算资源等成本只需几十美元。

　　s1的核心创新在于采用了“知识蒸馏”技术和“预算强制”方法。“知识蒸馏”好比把别人酿好的酒进一步提纯。该模型训练数据是基于谷歌Gemini Thinking Experimental模型“蒸馏”出的仅有1000个样本的小型数据集。

　　“预算强制”则使用了AI模型训练新方法——“测试时扩展”的实现方式。“测试时扩展”又称“深度思考”，核心是在模型测试阶段，通过调整计算资源分配，使模型更深入思考问题，提高推理能力和准确性。

　　“预算强制”通过强制提前结束或延长模型的思考过程，来影响模型的推理深度和最终答案。s1对阿里云的通义千问开源模型进行微调，通过“预算强制”控制训练后的模型计算量，使用16个英伟达H100 GPU仅进行26分钟训练便达成目标。

　　美国加利福尼亚大学伯克利分校研究团队最近也开发出一款名为TinyZero的精简AI模型，称复刻了DeepSeek-R1 Zero在倒计时和乘法任务中的表现。该模型通过强化学习，实现了部分相当于30亿模型参数的大语言模型的自我思维验证和搜索能力。团队称项目训练成本不到30美元。

　　“二次创造”增强AI普惠性

　　清华大学计算机系长聘副教授刘知远接受记者采访时说，部分海外研究团队使用DeepSeek-R1、o1等高性能推理大模型来构建、筛选高质量长思维链数据集，再用这些数据集微调模型，可低成本快速获得高阶推理能力。

　　相关专家认为，这是AI研发的有益尝试，以“二次创造”方式构建模型增强了AI普惠性。但有三点值得注意：

　　首先，所谓“几十美元的低成本”，并未纳入开发基座大模型的高昂成本。这就好比盖房子，只算了最后装修的钱，却没算买地、打地基的钱。AI智库“快思慢想研究院”院长田丰告诉记者，几十美元成本只是最后一个环节的算力成本，并未计算基座模型的预训练成本、数据采集加工成本。

　　其次，“二次创造”构建的模型，整体性能尚无法比肩成熟大模型。TinyZero仅在简单数学任务、编程及数学益智游戏等特定任务中有良好表现，但无法适用于更复杂、多样化的任务场景。而s1模型也只能通过精心挑选的训练数据，在特定测试集上超过早期版本o1 preview，而远未超过o1正式版或DeepSeek-R1。

　　最后，开发性能更优越的大模型，仍需强化学习技术。刘知远说，就推动大模型能力边界而言，“知识蒸馏”技术意义不大，未来仍需探索大规模强化学习技术，以持续激发大模型在思考、反思、探索等方面的能力。

　　AI模型未来如何进化

　　在2025年美国消费电子展上，美国英伟达公司高管为AI的进化勾画了一条路线图：以智能水平为纵轴、以计算量为横轴，衡量AI模型的“规模定律”呈现从“预训练扩展”到“训练后扩展”，再到“测试时扩展”的演进。

　　“预训练扩展”堪称“大力出奇迹”——训练数据越多、模型规模越大、投入算力越多，最终得到AI模型的能力就越强。目标是构建一个通用语言模型，以GPT早期模型为代表。而“训练后扩展”涉及强化学习和人类反馈等技术，是预训练模型的“进化”，优化其在特定领域的任务表现。

　　随着“预训练扩展”和“训练后扩展”边际收益逐渐递减，“测试时扩展”技术兴起。田丰说，“测试时扩展”的核心在于将焦点从训练阶段转移到推理阶段，通过动态控制推理过程中的计算量（如思考步长、迭代次数）来优化结果。这一方法不仅降低了对预训练数据的依赖，还显著提升了模型潜力。

　　三者在资源分配和应用场景上各有千秋。预训练像是让AI模型去学校学习基础知识，而后训练则是让模型掌握特定工作技能，如医疗、法律等专业领域。“测试时扩展”则赋予了模型更强推理能力。

　　AI模型的迭代还存在类似摩尔定律的现象，即能力密度随时间呈指数级增强。刘知远说，2023年以来，大模型能力密度大约每100天翻一番，即每过100天，只需要一半算力和参数就能实现相同能力。未来应继续推进计算系统智能化，不断追求更高能力密度，以更低成本，实现大模型高效发展。

　　（新华社北京2月23日电记者彭茜）

　　《光明日报》（2025年02月24日 12版）

[ 责编：田新宇 ]

阅读剩余全文（）

您此时的心情

新闻表情排行日/周

开心

0
难过

0
点赞

0
飘过

0

视觉焦点

第二十一届文博会闭幕
“国门铁路”警察守护旅客平安路

最热文章

推荐阅读

不夜星球，人类正在丢失睡眠？

“黑夜给了我黑色的眼睛，我却用它寻找光明。”

2025-05-27 13:22

中国科学家王小云获2025年“世界杰出女科学家奖”

“世界杰出女科学家奖”由联合国教科文组织和法国欧莱雅基金会在1998年联合设立

2025-05-27 11:10

以“中国强度”托举大飞机翱翔长空

无法释放起落架的民航客机在巨大的摩擦声中以机腹着地方式从跑道上滑过，高速进入大气层的空天飞机像一个“火球”剧烈燃烧，大型运输机在超强暴风雪中艰难起飞，先进战斗机在复杂空战环境中被导弹碎片打得千疮百孔……

2025-05-27 09:27

地幔氧化还原状态研究获进展

近日，中国科学院广州地球化学研究所副研究员高名迪与研究员王煜、中国科学院院士徐义刚，以及澳大利亚国立大学教授Stephen Foley合作，通过高温高压实验与超深金刚石包裹体成分对比研究，揭示了再循环碳酸盐如何改变地幔氧化还原状态，及对克拉通演化和深部碳循环的影响。

2025-05-27 09:22

“清淤利器”会“开刀”能“思考”

“浚澜”船配备了高压岸电接入模块，可以采用全电力驱动挖掘系统，实现施工作业零碳排放。

2025-05-27 09:16

天问二号任务计划5月29日实施发射

天问二号探测器按计划完成了技术区总装、测试、加注、转场、功能检查、联合测试等工作。

2025-05-27 09:10

我科学家揭开全球甲烷源汇变化的秘密

研究发现，自20世纪80年代以来，北半球高纬地区大气甲烷浓度的季节振幅呈现减弱趋势，而副热带及热带地区的季节振幅却显著增强。这一变化趋势及其空间差异为解析全球甲烷源汇的长期演变提供了关键观测证据，为全球甲烷减排提供了科学支撑。

2025-05-27 09:09

英媒：符合美国监管要求背景下，英伟达拟再推“中国特供”芯片

据两位消息人士透露，英伟达还在为中国开发另一款采用Blackwell架构的芯片，最早可能于9月开始生产。

2025-05-26 12:51

科学家用干细胞培育出迄今最先进羊膜囊

研究人员成功诱导干细胞发育成充满液体的羊膜囊。这种模型囊体直径约2厘米，相当于一个4周胚胎周围羊膜囊的实际大小，可用于研究早期妊娠。

2025-05-26 09:21

牙齿为何会敏感？原来是远古鱼“遗传”

你有过牙齿酸酸胀胀的体验吗？这会让我们真切地感受到牙齿有多敏感。其实，在咀嚼食物时，这种敏感性大有用处，它能提供关于温度、压力，还有疼痛方面的重要信息。

2025-05-26 09:18

“不可能存在”的宇宙棒状结构发现

最新一期《自然》杂志发表的论文报告发现一个原以为“不可能存在”的神秘结构。

2025-05-26 09:18

守护好三江源这个“中华水塔”

阿尼玛卿雪山保存着50余条冰川，年均径流量占黄河上游总流量35%，其变化对黄河流域水资源具有重要影响。

2025-05-26 09:16

让AI为农业现代化注入更多动能

如今，在各地田间地头，植保无人机凌空起舞、无人拖拉机破土前行、水肥一体精准施肥、北斗导航精准播种、智能机器人全天候巡检……科技感十足的农耕图景随处可见。

2025-05-26 09:15

辟谣｜你被“断碳减肥法”骗了多久？

可持续的减肥从不靠极端节食，而是科学的生活习惯。

2025-05-23 13:30

西安电子科技大学科研团队：给基因治疗装上“安全导航”

邓宏章对此形象地比喻：“传统LNP像‘硬闯城门’的士兵，难免伤及无辜；而TNP则是‘和平访问’的来客，以最小代价达成使命。”

2025-05-23 13:13

我国科技服务业实现量增质升并举发展

加强统筹协调，健全部际协同、央地协作、区域合作的工作机制，创新体制机制，加大政策支持，加强统计监测，深化开放合作，着力提升科技服务业发展环境。

2025-05-23 13:50

第九个全国科技工作者日在即，数千项活动陆续开展

以“矢志创新发展，建设科技强国”为主题的第九个全国科技工作者日系列活动将于近期陆续开展。

2025-05-23 13:01

我国科学家借助“天眼”发现罕见掩食脉冲星

这一发现对恒星演化理论、致密星吸积物理和双星并合引力波源研究具有重要意义。

2025-05-23 08:01

《柳叶刀》发布预测：2030年超10亿青少年健康堪忧

若不采取紧急行动，到2030年，全球至少半数青少年（超10亿人）将生活在健康风险高发的“多重负担国家”，面临HIV感染、早孕、抑郁、营养不良等多重威胁。

2025-05-23 09:13

“隐形眼镜”助人类识别复杂近红外图形

中国科学技术大学生命科学与医学部薛天、马玉乾团队与国内外科研机构合作，制备出高透明、高转化效率的上转换隐形眼镜，可实现人类近红外时空色彩图像视觉能力。相关研究成果5月22日在线发表在国际期刊《细胞》上。

2025-05-23 08:55

加载更多

全部导航

全球科研团队竞逐低成本AI模型研发新范式

相关阅读

您此时的心情

视觉焦点

最热文章

独家策划