点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:中国软件评测中心发布大模型报告:文心大模型在智能体、多模型创新具备先发优势
首页> 科技频道> 人工智能 > 正文

中国软件评测中心发布大模型报告:文心大模型在智能体、多模型创新具备先发优势

来源:光明网2024-07-10 11:32

  近日,中国软件评测中心发布《人工智能大语言模型技术发展研究报告(2024年)》,总结梳理大语言模型技术能力进展和应用情况,肯定国产大模型的发展成果,为产业界选用大模型提供了权威参考。报告显示,文心大模型技术、产品、应用全面领先,在智能体、多模型创新具备先发优势。

  报告认为,百度文心大模型在芯片、框架、模型和应用领域进行全栈布局,在理解、生成、逻辑、记忆等基础能力以及安全能力方面全面领先,在智能体、多模型等模式引领技术创新、生态丰富,在大模型应用开发平台方面功能完备、应用领域广泛。目前,文心大模型4.0 Turbo已正式发布,速度更快,效果更好,网页版、APP、API已陆续面向用户开放。

  算力、数据、算法是大模型三大基石,深度学习框架至关重要

  报告指出,软硬协同的算力底座,高丰富度、高质量的数据,持续优化与创新的算法是大模型的技术基石。尤其是 AI 芯片、深度学习框架、大规模算力集群等构成的算力底座是实现大模型高效稳定训练的基础。深度学习框架扮演了至关重要的角色,百度飞桨(PaddlePaddle)是其中的代表。

  飞桨集核心框架、基础模型库、端到端开发套件、丰富的工具组件于一体,实现了动静统一的框架设计,兼顾科研和产业需求,在开发便捷的深度学习框架、大规模分布式训练、高性能推理引擎、产业级模型库等技术上具备优势。目前,专为大模型设计的飞桨新一代框架3.0已经发布,具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力。最新数据显示,截至目前,飞桨已拥有1465万开发者,服务37万家企事业单位,基于飞桨创建了95万个模型,稳居中国深度学习平台市场综合份额第一。

  飞桨深度学习平台提供了高效的分布式训练架构,在万卡集群上,飞桨能够支持超大规模的模型训练任务,实现大量计算节点之间的高效协同,更好地完成大模型的训练任务,这不仅提高了训练效率,而且降低了训练成本。目前,文心大模型的周均训练有效率已达到98.8%,相比2023年文心一言发布时,训练效率提升到当时的5.1倍,推理性能提升到105倍。

  在算法优化方面,国内大模型厂商通过多阶段对齐、知识增强等加速提升大模型性能。百度采用有监督精调、偏好学习和强化学习等技术进行多阶段对齐,逐步校准模型的行为,更准确地反映人类的意图和偏好。报告强调,百度文心大模型4.0还在输入、输出两个阶段都运用知识点增强,提升大模型的准确性,做出更准确的预测和决策。

  文心大模型综合能力、效率优势明显,智能体成重要发展方向

  报告显示,百度文心大模型在中文内容的生成和推理方面的能力十分优秀。在生成方面,文心大模型能根据给定的上下文或主题生成自然、流畅、富有创意的文本内容;在推理方面,能在应对复杂问题时进行深入分析和逻辑推理,给出更加准确和全面的答案。这使得文心大模型在中文语言处理领域具有独特的优势和价值。

  智能体是开发最简单的AI应用,是大模型最看好的AI应用方向。以文心大模型为例,百度基于基础模型,进一步进行思考增强训练得到思考模型。智能体可以通过思考模型的理解、规划、反思能力,调用多个工具,完成复杂的任务。对 AI 开发者来说,在搭建智能体时,百度这样的大模型服务商只要给出可调用的工具,以及相应的“说明书”即可。

  报告中提到智能体的另一大应用是“代码智能体”。近日,百度智能代码助手Comate发布中文名“文心快码”,并升级至2.5版本。目前百度80%的工程师已经在深度使用文心快码,代码采纳率已达到46%,新增代码生成占比29%。

  百度首提多模型应用理念,大模型落地持续领先

  报告认为,未来大模型的发展趋势包括多模态数据融合、提升自适应和迁移学习能力、可解释性算法提高模型透明度、提升产品研发针对性和定制化水平,以及从垂直领域入手开发专用大模型产品等。面对未来趋势,报告认为以文心大模型为代表的国产大模型在技术和产品上已具备显著特点,形成了一定的优势。

  目前,文心大模型的模型研发平台化效率已实现快速提升,背后是百度在芯片、框架、模型和应用领域的全栈布局和端到端优化。从应用角度看,除基础模型的本身外,文心大模型已经发展出智能体、多模态等多种创新应用模式,出现代码生成、文生图、视频生成、数字人、自动驾驶等丰富多样的应用生态。针对大模型的落地,百度在2024年AI开发者大会上首提多模型应用理念。研发侧通过大小模型协同训练机制,高效、低成本地进行模型生产;应用侧构建智能路由模型,发挥不同模型处理不同任务的能力,达到效果、效率和成本的动态平衡。

  2023年以来,人工智能大模型开启新一轮人工智能发展浪潮,成为科技产业发展强劲动能。2024年则有望成为大模型商业落地元年。百度文心大模型等国产模型在底层技术、核心能力和创新应用上展现出可贵的发展态势,具有广阔的应用前景和巨大的潜力。(科文)

[ 责编:李欣哲 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 宁夏:社火欢腾闹新春

  • 青海原子城里的“开学第一课”

独家策划

推荐阅读
太空探索技术公司下属企业xAI为该项目另一竞争方,尽管其创始人埃隆·马斯克长期表示反对开发“杀人的新工具”。
2026-03-02 13:02
国家能源局发布的数据显示:截至2025年底,我国可再生能源总装机达到23.4亿千瓦。
2026-03-02 09:57
多国正将AI、物联网与大数据融入现有空气监测体系,追踪大气变化,预警污染风险,为人类在数字时代的每一次呼吸保驾护航。
2026-03-02 09:56
北部湾海域油田无人机系统运营项目正式落地,这是我国海上油田首次实现无人机规模化作业,为海洋能源开发与低空经济融合提供了实践范例。
2026-03-02 09:55
很多人都有过这样的疑问:AI离真正成为“人”,到底还有多远?研究人员表示:有突破,但仍有难以逾越的鸿沟,短期内无法实现“类人完整智能”。
2026-03-02 09:55
人工智能不再只会“死记硬背”了——我国科研团队最新研发出一种新型神经网络,让AI能像人类一样,从看到、听到的信息里自己提炼概念、理解含义,还能互相交流。
2026-03-02 09:53
国家统计局2月28日公布《2025年国民经济和社会发展统计公报》。
2026-02-28 17:21
人们常说“眼见为实”,但如果今天再问一个问题:照片还能算现实的记录吗?答案或许已经不像过去那么简单。
2026-02-28 10:27
国家能源局27日发布的数据显示,目前,全国已有84个绿电直连项目完成审批,新能源总装机规模3259万千瓦。
2026-02-28 10:25
“具身天工3.0”刚刚发布——首届机器人半马赛事冠军正在加紧训练,成绩有望大幅提升;朱雀三号重复使用火箭蓄势待发,计划二季度再次挑战回收复用;小米汽车超级工厂的生产线一片繁忙,累计交付量已突破60万辆……
2026-02-28 10:23
今年以来,水利部指导督促各地抢抓河湖枯水期、施工影响小的窗口期,不断推动国家水网联网、补网、强链。
2026-02-28 10:22
几十年来,关于月球早期磁场是强是弱,科学界一直争论不休。如今,英国牛津大学科学家通过分析阿波罗任务带回的样本,发现月球曾拥有极强磁场,强度甚至一度超过地球磁场。
2026-02-28 10:19
发现分数量子反常霍尔效应和里德堡莫尔激子态,解决超导量子计算难题,攻克国产无液氦稀释制冷机和极高场全超导磁体等关键实验技术……
2026-02-27 09:39
2026年伊始,从美国拉斯维加斯消费电子展(CES)到中国春晚,中国自主研发的人形机器人频频“破圈”,多家中国企业的产品和应用不仅在海外业界引发热议,更是在全球社交媒体平台和国际媒体不断“刷屏”。
2026-02-27 09:36
中国人的“果盘子”里,苹果占据着举足轻重的地位。产业端加速向“数管+机器换人”转型,直播带货、跨境电商等新业态的兴起,也让中国苹果加速走向全球。
2026-02-27 09:35
随着2022年北京冬奥会的成功举办和“带动三亿人参与冰雪运动”目标的实现,中国滑雪装备产业正迎来前所未有的发展机遇。从笨重单调到轻便智能,从依赖进口到本土品牌崛起,滑雪装备的变迁不仅折射出中国冰雪运动的普及,更勾勒出一个新兴消费市场的崛起轨迹。
2026-02-27 09:32
记者从西北大学获悉,该校生命科学学院灵长类行为与进化发育研究团队的研究,揭示了亚洲叶猴物种表型的演化之谜。
2026-02-27 09:30
中国科学院近代物理研究所核结构研究团队与合作者通过高精度实验,明确了一种钼同位素释放其储存能量的关键机制,在原子核能量可控释放研究领域取得重要进展。
2026-02-26 09:46
电感器如同现代电子设备的“心脏”,让电流有序流动、设备稳定工作。
2026-02-26 09:35
“AI保姆”“智能教育助手”等产品,正以前所未有的速度和深度涌入未成年人的世界。不少家长感叹,这位无所不能、无时不在的“数字家教”成了解放自己的好帮手。
2026-02-26 13:44
加载更多