点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:文心大模型4.5系列正式开源 涵盖10款模型
首页> 科技频道> 人工智能 > 正文

文心大模型4.5系列正式开源 涵盖10款模型

来源:光明网2025-06-30 15:15

  6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心大模型4.5开源系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列开源模型

  此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。

  据介绍,文心大模型4.5开源系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后训练等关键技术点。

  此外,文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,其系列模型在多个文本和多模态基准测试中达到SOTA水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。

  在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越DeepSeek-V3、Qwen3等模型。在多模态模型方面,文心大模型4.5开源系列拥有卓越的视觉感知能力,同时精通丰富视觉常识,并实现了思考与非思考统一,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。此外,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的Qwen3相当,文心4.5-VL-28B-A3B多模态模型也是目前同量级最好的多模态开源模型,甚至与更大参数模型Qwen2.5-VL-32B不相上下。

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5预训练模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5-300B-A47B模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列正式开源 涵盖10款模型

文心多模态后训练模型(支持思考、关闭思考)在多个多模态基准测试中达到SOTA水平

  据了解,文心大模型4.5开源系列权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低模型的后训练和部署门槛。

  作为国内最早投入AI研发的企业之一,百度在算力、框架、模型到应用的四层布局构建了明显的AI全栈技术优势。其中,飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,基于多年飞桨开源技术与生态系统积累,此次文心大模型4.5开源系列同步升级发布文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy,为文心大模型4.5系列及开发者提供开箱即用的工具和全流程支持。

  值得关注的是,此次文心大模型4.5系列开源后,百度实现了框架层与模型层的“双层开源”,为行业树立了新标杆。(记者 武玥彤)

[ 责编:谢芸 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 以军再次轰炸贝鲁特南郊

独家策划

推荐阅读
(记者冯丽妃)3月4日,全国政协十四届四次会议首场“委员通道”集体采访活动在北京人民大会堂举行。”  令人欣慰的是,潘建伟表示,通过国家重大科研任务的锤炼,我国量子科技研究队伍呈现年轻化、跨学科交叉的特点,并且兼具前沿探索和工程攻关的能力。
2026-03-05 09:56
全国人大代表、广东茂名化州市培林橘红种植专业合作社社长廖志略带来的化橘红树苗。这是全国人大代表、广东茂名化州市培林橘红种植专业合作社社长廖志略制作的集纳了乡亲们笑脸的3D照片。
2026-03-05 09:56
在天津市滨海新区,海上油气平台建设工人操作打磨机器人。不仅是我们团队,金凤实验室已为入驻科学家搭建病理表型组平台、纳米合成平台等8个国际领先的科研平台,提供科研设施设备超过6000台套。
2026-03-05 09:56
中国科学院广州地球化学研究所王强研究员团队联合国际合作者的一项最新研究给出了答案:高原并非一直向上生长,而是经历了两次“抬升—沉降”的起伏旋回。“青藏高原的生长不是简单的‘长高’,而是多阶段‘抬升—沉降’交替的结果。
2026-03-05 09:56
全国政协委员、宁德时代新能源科技股份公司董事长曾毓群从产业实战经历出发,分享了独属我国新能源事业的攀登故事。他坚信,秉持攀登精神、锚定目标,脚踏实地、勇毅笃行,就没有越不过去的险峰,就没有实现不了的梦想!
2026-03-05 09:56
在从事概率地震危险性分析、地震灾害风险评估工作中,我深刻感受到新兴技术发展日新月异,大大提升了我国的防灾减灾能力。
2026-03-04 09:42
从火星之上的精细探测,到地球深处探测的装备突破,我们用持续的创新创造,把关键核心技术牢牢掌握在中国人自己手中,为培育新质生产力、促进高质量发展贡献力量。
2026-03-04 09:41
我们始终坚持教育、科技、人才一体发展,推行“本硕博一体贯通+产业+专家+基地”模式,通过“博士村长”计划,培养了一大批知农爱农的复合型人才。
2026-03-04 09:40
回望“十四五”,中国经济在世界百年未有之大变局中彰显强大韧性,让我对高质量发展路径有了更深刻的认知。
2026-03-04 09:39
中国科学院国家天文台,年过八旬的中国科学院院士汪景琇春节假期一直在办公室忙碌,“有篇科普文章刚开了头,得抓紧写出来。”
2026-03-04 09:38
从实验室到产业化应用并不容易。王鹤说:“企业要想迅速响应市场需求,需要强化企业创新主体地位,让创新链和产业链无缝对接。”
2026-03-04 09:37
创新驱动是产业从“量大”走向“质强”的关键一跃,更是培育新质生产力的主引擎。
2026-03-04 09:36
我国生成式人工智能用户规模和普及率快速提升。
2026-03-03 09:37
本报讯(记者陶稳 通讯员张莹)突然出现头晕、头痛、视力障碍、肢体麻木无力,持续几分钟到几小时,无法缓解……遇到这些情况别大意,可能是“沉默的杀手”脑梗死在作祟。
2026-03-03 09:35
近日,中国科学院青岛生物能源与过程研究所太阳能光电转化与利用全国重点实验室联合香港科技大学研究团队,在钙钛矿太阳能电池埋底界面工程领域取得重要突破。
2026-03-03 09:34
今年元宵节,适逢月全食。新华社发(刘兵 摄)  本次月全食将从3日傍晚开始,整个过程主要分为半影食始、初亏、食既、食甚、生光、复圆、半影食终七个阶段。2025年9月7日夜晚至8日凌晨,在山西大同古城墙乾楼拍摄的月全食轨迹(多张堆栈),形似“金箍棒”。
2026-03-03 09:33
水稻患上了病毒病,往往矮化、分蘖(稻等植物发育的时候,在幼苗靠近土壤的茎节上生出分枝)增多,严重的甚至绝收。这一成果不仅解决了困扰学界的植物抗病毒免疫扩增谜题,更为培育“抗病不减产”的水稻新品种开辟了全新路径。
2026-03-03 09:33
这三项国家标准是:《食品安全国家标准 植物源性食品中352种农药及其代谢物残留量的测定液相色谱-质谱联用法》《食品安全国家标准 植物源性食品中242种农药及其代谢物残留量的测定 气相色谱-质谱联用法》和《食品安全国家标准植物源性食品中草甘膦等4种农药及其代谢物残留量的测定 液相色谱-质谱联用法》。
2026-03-03 09:32
由中国科学院古脊椎动物与古人类研究所主导的一项研究,在江西省九江市武宁县志留纪地层中发现盔甲鱼类大庸鱼科一新属种——武宁西海鱼。
2026-03-03 09:32
太空探索技术公司下属企业xAI为该项目另一竞争方,尽管其创始人埃隆·马斯克长期表示反对开发“杀人的新工具”。
2026-03-02 13:02
加载更多