点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:中国软件评测中心发布大模型报告:文心大模型在智能体、多模型创新具备先发优势
首页> 科技频道> 人工智能 > 正文

中国软件评测中心发布大模型报告:文心大模型在智能体、多模型创新具备先发优势

来源:光明网2024-07-10 11:32

  近日,中国软件评测中心发布《人工智能大语言模型技术发展研究报告(2024年)》,总结梳理大语言模型技术能力进展和应用情况,肯定国产大模型的发展成果,为产业界选用大模型提供了权威参考。报告显示,文心大模型技术、产品、应用全面领先,在智能体、多模型创新具备先发优势。

  报告认为,百度文心大模型在芯片、框架、模型和应用领域进行全栈布局,在理解、生成、逻辑、记忆等基础能力以及安全能力方面全面领先,在智能体、多模型等模式引领技术创新、生态丰富,在大模型应用开发平台方面功能完备、应用领域广泛。目前,文心大模型4.0 Turbo已正式发布,速度更快,效果更好,网页版、APP、API已陆续面向用户开放。

  算力、数据、算法是大模型三大基石,深度学习框架至关重要

  报告指出,软硬协同的算力底座,高丰富度、高质量的数据,持续优化与创新的算法是大模型的技术基石。尤其是 AI 芯片、深度学习框架、大规模算力集群等构成的算力底座是实现大模型高效稳定训练的基础。深度学习框架扮演了至关重要的角色,百度飞桨(PaddlePaddle)是其中的代表。

  飞桨集核心框架、基础模型库、端到端开发套件、丰富的工具组件于一体,实现了动静统一的框架设计,兼顾科研和产业需求,在开发便捷的深度学习框架、大规模分布式训练、高性能推理引擎、产业级模型库等技术上具备优势。目前,专为大模型设计的飞桨新一代框架3.0已经发布,具有动静统一自动并行、编译器自动优化、大模型训推一体、大模型多硬件适配四大能力。最新数据显示,截至目前,飞桨已拥有1465万开发者,服务37万家企事业单位,基于飞桨创建了95万个模型,稳居中国深度学习平台市场综合份额第一。

  飞桨深度学习平台提供了高效的分布式训练架构,在万卡集群上,飞桨能够支持超大规模的模型训练任务,实现大量计算节点之间的高效协同,更好地完成大模型的训练任务,这不仅提高了训练效率,而且降低了训练成本。目前,文心大模型的周均训练有效率已达到98.8%,相比2023年文心一言发布时,训练效率提升到当时的5.1倍,推理性能提升到105倍。

  在算法优化方面,国内大模型厂商通过多阶段对齐、知识增强等加速提升大模型性能。百度采用有监督精调、偏好学习和强化学习等技术进行多阶段对齐,逐步校准模型的行为,更准确地反映人类的意图和偏好。报告强调,百度文心大模型4.0还在输入、输出两个阶段都运用知识点增强,提升大模型的准确性,做出更准确的预测和决策。

  文心大模型综合能力、效率优势明显,智能体成重要发展方向

  报告显示,百度文心大模型在中文内容的生成和推理方面的能力十分优秀。在生成方面,文心大模型能根据给定的上下文或主题生成自然、流畅、富有创意的文本内容;在推理方面,能在应对复杂问题时进行深入分析和逻辑推理,给出更加准确和全面的答案。这使得文心大模型在中文语言处理领域具有独特的优势和价值。

  智能体是开发最简单的AI应用,是大模型最看好的AI应用方向。以文心大模型为例,百度基于基础模型,进一步进行思考增强训练得到思考模型。智能体可以通过思考模型的理解、规划、反思能力,调用多个工具,完成复杂的任务。对 AI 开发者来说,在搭建智能体时,百度这样的大模型服务商只要给出可调用的工具,以及相应的“说明书”即可。

  报告中提到智能体的另一大应用是“代码智能体”。近日,百度智能代码助手Comate发布中文名“文心快码”,并升级至2.5版本。目前百度80%的工程师已经在深度使用文心快码,代码采纳率已达到46%,新增代码生成占比29%。

  百度首提多模型应用理念,大模型落地持续领先

  报告认为,未来大模型的发展趋势包括多模态数据融合、提升自适应和迁移学习能力、可解释性算法提高模型透明度、提升产品研发针对性和定制化水平,以及从垂直领域入手开发专用大模型产品等。面对未来趋势,报告认为以文心大模型为代表的国产大模型在技术和产品上已具备显著特点,形成了一定的优势。

  目前,文心大模型的模型研发平台化效率已实现快速提升,背后是百度在芯片、框架、模型和应用领域的全栈布局和端到端优化。从应用角度看,除基础模型的本身外,文心大模型已经发展出智能体、多模态等多种创新应用模式,出现代码生成、文生图、视频生成、数字人、自动驾驶等丰富多样的应用生态。针对大模型的落地,百度在2024年AI开发者大会上首提多模型应用理念。研发侧通过大小模型协同训练机制,高效、低成本地进行模型生产;应用侧构建智能路由模型,发挥不同模型处理不同任务的能力,达到效果、效率和成本的动态平衡。

  2023年以来,人工智能大模型开启新一轮人工智能发展浪潮,成为科技产业发展强劲动能。2024年则有望成为大模型商业落地元年。百度文心大模型等国产模型在底层技术、核心能力和创新应用上展现出可贵的发展态势,具有广阔的应用前景和巨大的潜力。(科文)

[ 责编:李欣哲 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 今年前6个月西部陆海新通道班列运量同比增长76.9%

  • 贵州榕江:送别抗洪抢险救援队伍

独家策划

推荐阅读
2025全球数字经济大会2日在北京开幕。除收录标准的优势外,东壁全球科技文献数据平台还根据中国科技界与教育界的习惯,对所收录期刊进行了学科分类。
2025-07-04 09:55
超材料是一类具有特殊性质的人造材料,而具有热辐射性能的超材料可以把多余的热量“打包”传递到外界,热辐射超材料可广泛应用于零能耗辐射冷却、建筑节能降温、航天热控等诸多重要领域。
2025-07-04 09:53
中国科学院院士、海南大学生物医学工程学院教授骆清铭团队成功绘制出了小鼠三维脑区和立体定位图谱
2025-07-04 09:52
7月4日,神秘的水星将迎来东大距,这是今年第二次水星东大距,观测条件依然不错。
2025-07-04 09:51
科学是生产力的核心要素。
2025-07-04 09:50
钙钛矿太阳能电池因成本低、效率高、易加工等优势备受关注,可应用于光伏发电、车载光伏、光伏建筑等领域。
2025-07-03 09:59
目前,对于10厘米以上大型空间碎片,航天器通常采用主动规避的策略,通过轨道调整,避开可能的碰撞路径。
2025-07-03 09:58
6月26日,中国民航局官网发布公告,提到为切实保障航空运行安全,自2025年6月28日起,禁止旅客携带没有3C标识、3C标识不清晰、被召回型号或批次的充电宝乘坐境内航班。
2025-07-03 09:56
药膳制作师既要懂烹饪,是餐厅的大厨,又要懂中医药理论知识,特别是能够作为食药物质的中药材。
2025-07-03 09:55
运动有助于健康和抗衰老。但究竟是什么让运动有这种奇效呢?我国研究团队历时6年,首次系统解析了人体对急性单次运动与长期规律运动的分子-细胞动态响应谱,揭示肾脏是运动效应的关键应答器官——其内源代谢物甜菜碱作为衰老延缓的核心分子信使,通过靶向抑制天然免疫枢纽激酶TBK1,协同阻遏炎症并缓解多器官衰老进程。
2025-07-03 05:20
近日,四川乐山一小伙感觉身体不适独自乘出租车前往医院就诊,途中开启“超强自救”模式:联系妈妈告知情况、打110报警求助、打120告知医院准备急救。如果长期处于焦虑引起的躯体化障碍状态,患者会反复出现头痛、心慌、呼吸急促、胃肠紊乱、肢体疼痛、睡眠问题等。
2025-07-02 10:06
使用人工智能大模型时,不少人或许都遇到过类似问题:它们有时会捏造细节,甚至“一本正经地胡说八道”。当“喂给”大模型的训练数据包含虚假信息时,它就会产生“幻觉”、给出错误答案。
2025-07-02 10:05
中国国际航空公司所属的国产C909客机平稳降落在蒙古国乌兰巴托成吉思汗国际机场,标志着国航首条C909国际航线正式开通。早8时许,这架C909客机从呼和浩特起飞,经过1个多小时飞行抵达乌兰巴托。
2025-07-02 10:03
农业是国民经济的基础,农业领域形成新质生产力是国民经济形成和发展新质生产力的基础和“底盘”。 农业新质生产力是通过提升劳动者素质、优化劳动资料和创新利用劳动对象,实现全要素生产率的显著提高。
2025-07-02 10:01
团队基于卫星遥感数据构建了1988年至2021年青藏高原30米分辨率人工草地数据集,明确了青藏高原主要的人工草地类型及其时空分布特征,并揭示了青藏高原人工草地的迅速扩张及其驱动机制。
2025-07-02 09:59
屠光绍认为,金融机构在应用人工智能时必须在服务投资人与消费者之间寻求平衡,避免AI鸿沟,坚守金融服务大众的初心。鲍建敏倡导构建产学研深度融合、开放共赢的人工智能金融生态体系,搭建跨机构、跨领域的协同创新平台。
2025-07-01 10:13
6月30日,2025温布尔登网球锦标赛在英国伦敦拉开大幕,引发球迷关注。在草地球场,球的速度更快且弹跳不规则,比赛回合较短,发球就成为球员们的重要“武器”。红土球场并不是天然土壤,而是分层分布着碎砖粉、白色碎石灰石、碎石等。
2025-07-01 10:09
7月1日起,医保定点医药机构在销售药品时,必须按要求扫药品追溯码后方可进行医保基金结算;2026年1月1日起,所有医药机构都要实现药品追溯码全量采集上传。步,进入国家医保局微信公众号主页,点击服务、药品追溯信息查询,进入查询页面;或进入国家医保局微信公众号消息对话页,点击医保服务、药品追溯信息查询,进入查询页面。
2025-07-01 10:09
记者从国家航天局获悉,7月1日,该局发布行星探测工程天问二号探测器在轨获取的地月影像图。(国家航天局供图)  月球全色图,由天问二号探测器的窄视场导航敏感器于2025年5月30日15时拍摄,经辐射校正处理后制作而成。
2025-07-01 10:08
龙芯中科近日正式发布基于国产自主指令集龙架构研发的服务器处理器龙芯3C6000系列芯片、工控领域及移动终端处理器龙芯2K3000/3B6000M芯片以及相关整机和解决方案。
2025-07-01 10:06
加载更多