点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:中国软件评测中心发布大模型报告:文心大模型在智能体、多模型创新具备先发优势
首页> 科技频道> 人工智能 > 正文

中国软件评测中心发布大模型报告:文心大模型在智能体、多模型创新具备先发优势

来源:光明网2024-07-10 11:32

  近日,中国软件评测中心发布《人工智能大语言模型技术发展研究报告(2024年)》,总结梳理大语言模型技术能力进展和应用情况,肯定国产大模型的发展成果,为产业界选用大模型提供了权威参考。报告显示,文心大模型技术、产品、应用全面领先,在智能体、多模型创新具备先发优势。

  报告认为,百度文心大模型在芯片、框架、模型和应用领域进行全栈布局,在理解、生成、逻辑、记忆等基础能力以及安全能力方面全面领先,在智能体、多模型等模式引领技术创新、生态丰富,在大模型应用开发平台方面功能完备、应用领域广泛。目前,文心大模型4.0 Turbo已正式发布,速度更快,效果更好,网页版、APP、API已陆续面向用户开放。

  算力、数据、算法是大模型三大基石,深度学习框架至关重要

  报告指出,软硬协同的算力底座,高丰富度、高质量的数据,持续优化与创新的算法是大模型的技术基石。尤其是 AI 芯片、深度学习框架、大规模算力集群等构成的算力底座是实现大模型高效稳定训练的基础。深度学习框架扮演了至关重要的角色,百度飞桨(PaddlePaddle)是其中的代表。

  飞桨集核心框架、基础模型库、端到端开发套件、丰富的工具组件于一体,实现了动静统一的框架设计,兼顾科研和产业需求,在开发便捷的深度学习框架、大规模分布式训练、高性能推理引擎、产业级模型库等技术上具备优势。目前,专为大模型设计的飞桨新一代框架3.0已经发布,具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力。最新数据显示,截至目前,飞桨已拥有1465万开发者,服务37万家企事业单位,基于飞桨创建了95万个模型,稳居中国深度学习平台市场综合份额第一。

  飞桨深度学习平台提供了高效的分布式训练架构,在万卡集群上,飞桨能够支持超大规模的模型训练任务,实现大量计算节点之间的高效协同,更好地完成大模型的训练任务,这不仅提高了训练效率,而且降低了训练成本。目前,文心大模型的周均训练有效率已达到98.8%,相比2023年文心一言发布时,训练效率提升到当时的5.1倍,推理性能提升到105倍。

  在算法优化方面,国内大模型厂商通过多阶段对齐、知识增强等加速提升大模型性能。百度采用有监督精调、偏好学习和强化学习等技术进行多阶段对齐,逐步校准模型的行为,更准确地反映人类的意图和偏好。报告强调,百度文心大模型4.0还在输入、输出两个阶段都运用知识点增强,提升大模型的准确性,做出更准确的预测和决策。

  文心大模型综合能力、效率优势明显,智能体成重要发展方向

  报告显示,百度文心大模型在中文内容的生成和推理方面的能力十分优秀。在生成方面,文心大模型能根据给定的上下文或主题生成自然、流畅、富有创意的文本内容;在推理方面,能在应对复杂问题时进行深入分析和逻辑推理,给出更加准确和全面的答案。这使得文心大模型在中文语言处理领域具有独特的优势和价值。

  智能体是开发最简单的AI应用,是大模型最看好的AI应用方向。以文心大模型为例,百度基于基础模型,进一步进行思考增强训练得到思考模型。智能体可以通过思考模型的理解、规划、反思能力,调用多个工具,完成复杂的任务。对 AI 开发者来说,在搭建智能体时,百度这样的大模型服务商只要给出可调用的工具,以及相应的“说明书”即可。

  报告中提到智能体的另一大应用是“代码智能体”。近日,百度智能代码助手Comate发布中文名“文心快码”,并升级至2.5版本。目前百度80%的工程师已经在深度使用文心快码,代码采纳率已达到46%,新增代码生成占比29%。

  百度首提多模型应用理念,大模型落地持续领先

  报告认为,未来大模型的发展趋势包括多模态数据融合、提升自适应和迁移学习能力、可解释性算法提高模型透明度、提升产品研发针对性和定制化水平,以及从垂直领域入手开发专用大模型产品等。面对未来趋势,报告认为以文心大模型为代表的国产大模型在技术和产品上已具备显著特点,形成了一定的优势。

  目前,文心大模型的模型研发平台化效率已实现快速提升,背后是百度在芯片、框架、模型和应用领域的全栈布局和端到端优化。从应用角度看,除基础模型的本身外,文心大模型已经发展出智能体、多模态等多种创新应用模式,出现代码生成、文生图、视频生成、数字人、自动驾驶等丰富多样的应用生态。针对大模型的落地,百度在2024年AI开发者大会上首提多模型应用理念。研发侧通过大小模型协同训练机制,高效、低成本地进行模型生产;应用侧构建智能路由模型,发挥不同模型处理不同任务的能力,达到效果、效率和成本的动态平衡。

  2023年以来,人工智能大模型开启新一轮人工智能发展浪潮,成为科技产业发展强劲动能。2024年则有望成为大模型商业落地元年。百度文心大模型等国产模型在底层技术、核心能力和创新应用上展现出可贵的发展态势,具有广阔的应用前景和巨大的潜力。(科文)

[ 责编:李欣哲 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 中国社科院考古所发布考古领域研究成果

  • 浙江上虞:强化品牌传播 提振青瓷产业

独家策划

推荐阅读
  人工智能(AI)正以前所未有的速度重塑着教育形态。放眼全球,AI与教育深度融合已不是“未来时”,而是汹涌澎湃的“现在进行时”。在这场由硅基智慧引发的教育革命面前,世界各国都在“大显身手”,基于各自特有的文化背景、教育传统与国家发展战略定位,在“AI+教育”的实施路径上展现出“百花齐放”之势。
2026-05-28 02:10
  当前,我国科普阅读需求呈现出高意愿、高黏性、高集中度的特点。调研显示,成人科普图书核心读者以36岁以上成熟群体为主,占比达82%,女性读者占62%,绝大多数为本科学历以上,企业技术人员、教育科研工作者、都市职场人构成消费主力。超过六成读者每周阅读三次以上,近三分之一年均阅读10本以上,阅读稳定性显著高于其他大众图书。
2026-05-28 02:10
站在河北沧州南皮县乌马营镇徐和杨村的航丰家庭农场地头,放眼望去,成方连片的小麦已泛起嫩黄,一派“小满未满,将熟未熟”的景象。
2026-05-28 02:00
中国社会科学院考古研究所(中国历史研究院考古研究所)27日发布最新成果。2025年9月至今,考古研究所已出版考古报告13部,专著、学术资料、科普读物13部,图录、论文集、数据集8部,中英文顶级、权威期刊上的简报、论文30余篇,并积极建设实验室集刊平台。
2026-05-28 02:00
27日0时16分,我国在文昌航天发射场使用长征七号改运载火箭,成功将通信技术试验卫星二十四号发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-05-28 01:40
在提交毕业论文终稿的最后时刻,辽宁省某高校教育学专业研二学生宋耘(化名)还是选择了求助某“专门降论文AIGC(人工智能生成内容)率”的商家。
2026-05-28 01:40
中国卫星导航定位协会近日发布的《2026中国北斗时空产业发展白皮书》显示,2025年,北斗时空产业总产值达到13323亿元。北斗核心产品持续迭代升级,芯片、模组等基础产品小型化、低功耗、高精度水平不断提升,国内主流手机北斗定位精度持续优化,为产业规模化应用奠定了坚实的技术基础。
2026-05-27 09:36
5月27日0时16分,我国在文昌航天发射场使用长征七号改运载火箭,成功将通信技术试验卫星二十四号发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-05-27 09:26
“十五五”规划纲要提出,投资于物和投资于人紧密结合。
2026-05-27 03:00
大屏幕上的数字快速跳动。十几轮激烈竞逐后,最终定格在212.4万元,成交!这是日前记者在湖北碳排放权交易中心电子竞价大厅看到的一幕。
2026-05-27 03:10
检测AI率,目的是维护学术研究的严肃性公平性,督促学生遵守学术规范、产出原创成果。然而,在现实操作中,一系列困扰学生乃至老师、学校的问题接连显露。
2026-05-27 02:50
位于北京大兴区的长子营湿地公园,草木葱茏,水面澄澈,鸟鸣声清脆悦耳,勾勒出一幅生机盎然的生态画卷。
2026-05-26 09:24
我国虽然核电铀燃料对外依存度高,但钍资源储量丰富,目前探明钍储量位居世界第二。以钍作核燃料不仅符合我国资源禀赋,甚至可能改变未来全球能源格局。
2026-05-26 09:18
我国已累计发布1750项食品安全标准,涉及2万多个指标,覆盖340多种食品类别,持续完善科学严谨、好用管用的食品安全标准体系。
2026-05-26 09:11
入汛以来,全国平均降水量达110.1毫米,较常年同期偏多18.6%。从空间分布来看,我国南北方均出现降水量较常年同期明显偏多区域。
2026-05-26 09:11
5月30日将迎来第十个全国科技工作者日,中国科协将联合相关部委集中表彰第四届全国创新争先奖获奖团队和个人,发布2026年“最美科技工作者”年度人物。
2026-05-26 09:09
到今年5月21日,“澳门科学一号”(下称“澳科一号”)卫星成功发射三周年。卫星上天不是终点,3年来,“澳科一号”团队研发未曾停歇,在相关科学与技术领域取得多项重大突破。
2026-05-25 10:19
近来,词元(Token)一词持续刷屏科技圈、经济圈,而让它“破圈”的,是一组极具冲击力的数据——今年3月,我国日均词元调用量突破140万亿。从2024年初的1000亿,到2025年底的100万亿,再到突破140万亿,两年间增长超千倍。
2026-05-25 10:16
《中国生物物种名录2026版》封面。与去年的名录相比,2026版名录中,动物界新增3380个物种和477个种下单元;植物界新增431个物种,减少2个种下单元;真菌界新增3114个物种,减少1246个种下单元。
2026-05-25 10:02
平面单位距离问题探讨的是,在无限大的纸上,最多可以画出多少条等长的线段来连接纸上的点。Erdos证明了越来越大的网格如何能够包含大量距离相等的点,并且这个网格会以比点数增长略快的速度无限延伸。
2026-05-25 10:02
加载更多