点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:文心大模型4.5系列正式开源 涵盖10款模型
首页> 科技频道> 人工智能 > 正文

文心大模型4.5系列正式开源 涵盖10款模型

来源:光明网2025-06-30 15:15

  6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源。目前,文心大模型4.5开源系列已可在飞桨星河社区、HuggingFace等平台下载部署使用,同时开源模型API服务也可在百度智能云千帆大模型平台使用。早在今年2月,百度就已预告了文心大模型4.5系列的推出计划,并明确将于6月30日起正式开源。

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列开源模型

  此次百度一次性推出10款文心大模型4.5系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。

  据介绍,文心大模型4.5开源系列针对MoE架构提出了一种创新性的多模态异构模型结构,适用于从大语言模型向多模态模型的持续预训练范式,在保持甚至提升文本任务性能的基础上,显著增强了多模态理解能力,其优越的性能主要得益于多模态混合专家模型预训练、高效训练推理框架和针对模态的后训练等关键技术点。

  此外,文心大模型4.5开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型FLOPs利用率(MFU)达到47%。实验结果显示,其系列模型在多个文本和多模态基准测试中达到SOTA水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。

  在文本模型方面,文心大模型4.5开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越DeepSeek-V3、Qwen3等模型。在多模态模型方面,文心大模型4.5开源系列拥有卓越的视觉感知能力,同时精通丰富视觉常识,并实现了思考与非思考统一,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的OpenAI o1。此外,在轻量模型上,文心4.5-21B-A3B-Base文本模型效果与同量级的Qwen3相当,文心4.5-VL-28B-A3B多模态模型也是目前同量级最好的多模态开源模型,甚至与更大参数模型Qwen2.5-VL-32B不相上下。

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5预训练模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心4.5-300B-A47B模型在主流基准测试中表现优异

文心大模型4.5系列正式开源 涵盖10款模型

文心大模型4.5系列正式开源 涵盖10款模型

文心多模态后训练模型(支持思考、关闭思考)在多个多模态基准测试中达到SOTA水平

  据了解,文心大模型4.5开源系列权重按照Apache 2.0协议开源,支持开展学术研究和产业应用。此外,基于飞桨提供开源的产业级开发套件,广泛兼容多种芯片,降低模型的后训练和部署门槛。

  作为国内最早投入AI研发的企业之一,百度在算力、框架、模型到应用的四层布局构建了明显的AI全栈技术优势。其中,飞桨是中国首个自主研发、功能丰富、开源开放的产业级深度学习平台,基于多年飞桨开源技术与生态系统积累,此次文心大模型4.5开源系列同步升级发布文心大模型开发套件ERNIEKit和大模型高效部署套件FastDeploy,为文心大模型4.5系列及开发者提供开箱即用的工具和全流程支持。

  值得关注的是,此次文心大模型4.5系列开源后,百度实现了框架层与模型层的“双层开源”,为行业树立了新标杆。(记者 武玥彤)

[ 责编:谢芸 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 海南:伏季休渔结束 渔船避风暂缓出海

  • 绿意奔涌大运河

独家策划

推荐阅读
脂肪肝、血压偏高、空腹血糖异常……一些以往更多与中老年相关的健康问题,正悄然在不少年轻人身上显现。在糖尿病视网膜病变筛查方面,我们开发了DeepDR系统,利用人工智能助力基层医生解读眼底片子。
2025-08-15 09:54
现有的抗病毒药物只对特定病毒有效,因此,拥有一种作用广泛的治疗方法将极具价值。对于耐药性问题,Bogunovic认为,只要这种抗病毒药物包含一系列针对病毒不同生命周期的干扰素触发蛋白,病毒就不太可能对其产生耐药性。
2025-08-15 09:53
经过多年持续攻坚,数字领域突破了一批关键核心技术。据测算,2024年,上市数据企业平均研发投入较“十三五”末增长79%,产业链创新活力持续增强。
2025-08-15 09:45
我国又一个超千亿立方米的大型深层整装页岩气田诞生。
2025-08-15 09:42
随着电动交通、低空经济、消费电子、人形机器人等新兴领域迅速发展,人们对高能量、长续航可充放电池的需求日益迫切。
2025-08-15 09:40
截至目前,我国累计批准发布国家标准物质19007项,其中1—7月新批准发布国家标准物质549项,同比增长56%。
2025-08-14 10:29
一项发表于《自然-神经科学》的研究,首次成功建立了线粒体功能障碍与神经退行性疾病的因果关系。
2025-08-14 10:28
中国的黄牛育种终于有了自主、低成本的检测芯片!”
2025-08-14 10:27
提到全球变暖,人们往往首先想到二氧化碳、甲烷乃至氟利昂等能够加剧大气温室效应的温室气体。很多人不知道,大气中还存在一类可以抑制气候变暖的物质。而人类扩张农田等行为,可能在客观上导致大气中“降温物质”减少,进而加剧全球气候变暖。
2025-08-14 10:24
党的二十届三中全会明确提出,建立人工智能安全监管制度,完善生成式人工智能发展和管理机制。这就要求我们坚持统筹高质量发展和高水平安全,把创新作为第一动力、把安全作为底线要求、把普惠作为价值追求,积极融入“人工智能+”行动,鼓励和促进人工智能气象应用服务创新发展,前瞻应对人工智能技术应用带来的风险挑战。
2025-08-14 03:50
广东珠海以南海域,一座银灰色的三角形装置随波起伏。这里是我国自主研发的全球首台兆瓦级漂浮式波浪能发电装置“南鲲号”,日均发电量可达1万千瓦时,能满足约1500户家庭一天的用电需求。
2025-08-13 10:02
研究发现,在1950年至2020年间,极端高温的加剧导致热带地区陆栖鸟类的丰度下降了25%至38%。研究人员以地球生命力数据库中的全球陆栖鸟类种群数据作为研究起点,未包括水鸟和海鸟。
2025-08-13 10:01
中性原子体系因优异的扩展性、高保真度量子门、高并行性和任意的连接性,成为极具潜力的量子计算和量子模拟平台。审稿人高度评价这项研究工作,认为这一工作是原子相关量子物理领域在计算效率和实验可行性方面的一次重大飞跃。
2025-08-13 10:01
“植物如何整合复杂环境信号是深入理解植物生存智慧的关键,也是创制兼具养分高效利用与逆境抗性的未来作物新品种的理论基础。储成才团队相信,随着研究的深入,未来会有更多基于植物“生存智慧”的作物新品种出现,让农业更高效、更环保。
2025-08-13 10:01
8月12日是世界大象日。记者从国家林业和草原局亚洲象研究中心了解到,从最新一线监测数据看,我国野生亚洲象象群交流频繁、种群结构稳定、生育率稳步提升、
2025-08-13 03:45
团队需要从头开始,设计一款“更适合日本”的机器人:体形小巧,穿行灵活,语音系统换成日语,屏幕上的动画表情还能变换。擎朗智能目前在日本已经设立200多个技术支持点,确保常规故障能在2小时内响应,24小时内修复。
2025-08-12 10:06
夏季天气炎热,很多人喜欢去游泳馆游泳。“游泳可以提高心肺耐力和身体柔韧性,改善体脂率,因此受到越来越多人的喜爱。”潘力军说,游泳如果不注意卫生,可能感染红眼病、中耳炎和胃肠道疾病,建议做好如下防护措施:  游泳前,注意自身的健康状况。
2025-08-12 10:03
近日,随着最后一笔数据在青藏高原上录入系统,三江源国家公园正式完成自然资源确权登记。2019年,《关于统筹推进自然资源资产产权制度改革的指导意见》与《关于建立以国家公园为主体的自然保护地体系的指导意见》相继出台,“依法确权”成为基石。
2025-08-12 10:02
一般认为,宇宙中的每个星系中心都有一个超大质量黑洞,而更大的星系则拥有更大的黑洞,即超巨型黑洞。Collett表示,恒星运动学被视为黑洞质量测量的“金标准”,引力透镜效应则可以帮助团队“探测到更遥远的宇宙”。
2025-08-12 10:01
中国科学院大连化学物理研究所研究员杨维慎、彭媛团队开发了一种便捷的触发式界面反应策略,实现了二维金属-有机框架膜(MOF膜)的快速制备及高效气体分离。该研究为面向应用的MOF纳米片和超薄二维MOF膜的定制化制备提供了新思路,可满足不同应用场景下的高性能分离需求。
2025-08-12 10:00
加载更多