点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:文心大模型最新版有哪些技术创新?百度吴甜详解
首页> 科技频道> 人工智能 > 正文

文心大模型最新版有哪些技术创新?百度吴甜详解

来源:光明网2025-05-21 13:54

  5月20日,百度AI Day活动在北京举办,百度集团副总裁吴甜、中国信息通信研究院人工智能研究所平台与工程化部主任曹峰及文心一言用户代表陈君航现场分享了文心大模型最新技术、全球大模型发展及大模型能力测评、文心一言使用体验等。

  现场,中国信通院发布大模型推理能力评估结果。结果显示,百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

  文心大模型新版本技术详解

  吴甜对文心大模型最新版本的技术创新进行了系统性的讲解。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

文心大模型最新版有哪些技术创新?百度吴甜详解

  百度集团副总裁吴甜

  文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

  后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,让大模型拥有了自我迭代的“最强大脑”,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

  在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率。通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

  深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升,模型输出结果思路清晰、逻辑严密,表达自然。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

  数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

  吴甜也指出,大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。

  以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。截至目前,文心快码向全社会开放,累计服务760万开发者。

  文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化,包括框架模型的联合优化,也包括框架算力的联合优化。通过训练和推理的技术创新,文心4.5 Turbo训练吞吐达到文心4.5的5.4倍,推理吞吐达到8倍。公开数据显示,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。基于飞桨深度学习平台和文心大模型,百度在上海、广州、南京、武汉、厦门、宁波、南昌、无锡等多地落地产业赋能中心、数据生态中心和教育创新中心,以科技+人才+创新的模式打造区域人工智能公共技术服务平台,汇聚行业高价值数据集、培养新型复合型人才、赋能本地AI产品研发,构建围绕人工智能核心能力的“政产学研用”协同发展机制,加快区域产业智能化升级。

  国内首个!文心X1 Turbo获信通院“4+级”最高评级

  中国信息通信研究院人工智能研究所平台与工程化部主任曹峰从全球大模型发展、从测评看大模型能力演进以及文心大模型推理能力评测解读等行业视角在现场进行了趋势解读。他指出,2024年人工智能能力持续进化,在多任务语言理解、竞赛级数学、博士级科学问题等之前具有挑战性的基准测试中超越了人类的表现。

文心大模型最新版有哪些技术创新?百度吴甜详解

  中国信息通信研究院人工智能研究所平台与工程化部主任曹峰现场分享

  现场,曹峰公布了信通院大模型推理能力评估结果。百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。

  他进一步表示,评估结果表明,文心X1 Turbo擅长结构化的逻辑思考,并具备平衡模型能力与效率的优化技术,其有效的数据机制保障了模型的可信及可用程度,其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力,拓宽工具链应用生态,加强安全机制建设,构筑可信应用保障壁垒。

  16岁高中生:打开文心一言,就像打开新华字典一样

  活动现场,一位16岁高中学生陈君航分享了他使用文心一言的经历。他从2023年开始接触文心一言,自那以后,文心一言几乎陪伴了他整个中考备考过程。

  君航回忆,初次接触文心一言时,他正为语文作文的修改发愁,于是就把作文和老师点评发给文心一言,让它逐句分析给出修改建议。他坦言,“我打开文心一言,就像打开新华字典一样频繁。在它的陪伴下,我的写作能力得到很大提升。”

  君航表示,文心一言不仅帮他量身定制过阶段性的学习规划,还能解析搜题软件无法解析的原创题目。“在学习方面,文心一言就像我 24 小时在线的全能老师。”

文心大模型最新版有哪些技术创新?百度吴甜详解

  陈君航现场分享与文心一言的故事

  这位高一学生不仅自己爱用文心一言,还把他带给了母亲、同学、老师们。也让大家对AI有了新的认知。

  “我从小学时就开始对编程产生兴趣,但家人一直认为学编程只够作为一项兴趣爱好,反对我投入过多的时间在编程研究上。因此,到了晚上规定的时间,爸妈都会准时关闭电脑,要求我去学习或者休息。”

  但后来发生的事,让君航妈妈对他在编程上花时间的态度发生了转变。君航的妈妈是一位小学老师,平时在繁重的教学任务中,还要抽时间做很多案头工作。“我经常看到她一边批卷子一边熬夜写点评,五十几份,一句句手打。”所以君航想:“我能不能做点什么?”于是他开始尝试用文心一言,为妈妈设计了一个“智能文案生成器”,原本三天的工作仅需几小时就可以完成。这让君航的妈妈对编程有了新的认知,也激发了她自己对大模型的使用兴趣。

  当大模型学会像人类一样感知世界,像人类一样思考和行动并自我进化,技术进步便真正转化为普惠的社会红利。正如陈君航同学所说:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题”。(鸣耒)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “核心价值观百场讲坛”走进江苏南京

  • 舰耀香江:人民海军舰艇赴港影像志

独家策划

推荐阅读
在6月27日举行的首届西部商业航天大会现场,陕西西安高新区管委会主任陈辉端着一台银灰色的火箭发动机模型走向发布台。“我们要实现星箭总体环节的突破,大力引进培育卫星总体、火箭总体企业,支持卫星智能制造工厂和商业火箭总装线建设。
2026-06-30 10:01
近日,“共和国勋章”获得者、我国著名水稻专家袁隆平相关话题上了热搜。袁隆平带领我国科研工作者,通过雄性不育遗传工具,攻克了利用杂种优势的世界性难题,创建了系统化、原创性的杂交水稻育种体系,开辟出利用水稻杂种优势的新道路,有力保障了国家粮食安全。
2026-06-30 10:01
国家能源局29日发布数据显示,今年1至5月,全国累计完成电力市场交易电量30573亿千瓦时,同比增长24.8%。1至5月,从交易范围看,省内交易电量24361亿千瓦时,同比增长28.5%;跨省跨区交易电量6212亿千瓦时,同比增长12.2%。
2026-06-30 10:01
教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。在资源配置方面,需要强化规划衔接、政策协同,推动教育、科技、产业等多部门资源在人才培养这一共同目标下统筹配置。
2026-06-30 10:00
今年入夏以来,雷电、暴雨、大风等强对流天气轮番登场,其瞬间释放的破坏力令人心生畏惧。若身处人流密集区域,同行人不牵手,应立即进入安装有防雷装置的建筑物、金属车身的汽车等安全区域。
2026-06-30 10:00
美国核能初创企业Antares宣布,其在爱达荷国家实验室安装的小型模块化核反应堆“Mark-0”首次测试达到临界状态,成为特朗普政府发布加速核电发展行政命令以来,第一个突破这一门槛的新型反应堆设计。
2026-06-29 09:43
目前,油田油水井、站库的数字化覆盖率已分别超过97%和93%,物联网将油气生产的每一个末梢都纳入了智慧之网。
2026-06-29 09:41
中国共产党党员、中国工程院院士、著名金属材料专家、华中科技大学教授崔崑同志,因病医治无效,于2026年6月26日在武汉逝世,享年101岁。
2026-06-29 09:40
科学家成功把一束在纳米尺度下被高度囚禁的光,变成了一把能感知原子级形变的超级“尺子”,对材料内部埋藏的微小变形实现了无损探测。
2026-06-29 09:40
27日,国家重大科技基础设施“聚变堆主机关键系统综合研究设施”最大的超导部件——环向场磁体在安徽省合肥市完成最后制备工艺,并通过专家验收。
2026-06-29 09:37
当地时间24日,世界气象组织在日内瓦为中国工程院院士、中国气象局卫星气象专家许健民颁发第七十届国际气象组织奖,表彰他为天气预报、卫星气象事业以及气象业务服务作出的卓越贡献。
2026-06-26 09:28
来自英国伦敦国王学院与加拿大麦克马斯特大学衍生公司Block Biosciences等机构的科学家,正在研制一类靶向IMPDH2酶的候选药物。团队已设计并合成了数百种靶向IMPDH2的候选药物,正从中层层筛选最优化合物,力争尽快推向临床开发。
2026-06-26 09:26
6月25日,以“弘扬伟大抗疫精神 走好疾控新长征路”为主题的2026年“我和我的疾控故事”宣讲会在中国疾病预防控制中心举办。中国疾病预防控制中心性病艾滋病预防控制中心综合防治与政策室主任单多的故事,要从一双生了冻疮的手讲起。
2026-06-26 09:23
届链博会期间,贸促智库交流活动暨全球供应链报告与指数发布会在京举办。2018—2025年,促进指数、连接指数、创新指数、韧性指数均呈上行态势,表明全球供应链继续朝着更具韧性、更有效率、更富活力的方向发展。
2026-06-26 09:20
需要看到,保护耕地是推进乡村全面振兴、建设宜居宜业和美乡村的重要组成部分,广大农民是保护耕地的重要行动主体。
2026-06-26 09:19
卢宇彤介绍,“灵晟”依托国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等多项核心技术创新打造。如今,面向科学、工程、产业各领域的大规模应用需求,“灵晟”提供多学科、全流程、多精度融合的科学智能应用生产级平台。
2026-06-25 09:36
日内瓦时间6月24日,中国工程院院士许健民从世界气象组织秘书长塞莱丝特·绍洛手中郑重接过第70届国际气象组织奖奖章。作为我国气象卫星事业的开拓者、见证者,许健民的身影,也是中国气象人实干创新、勇攀高峰的生动写照。
2026-06-25 09:33
在中国与泰国联合倡议下,世界贸易组织信息技术协定委员会23日举办专题研讨会,围绕信息技术协定支持人工智能就绪及包容性数字化转型展开探讨。
2026-06-25 09:32
如果它们真的是宇宙中的某种全新的事物,将改变我们对宇宙的认知,正如20世纪60年代类星体(星系中心进食的黑洞)的发现彻底革新了星系演化理论一样。”  无论直接坍缩理论是否正确,小红点都可能是超大质量黑洞的前身,后者构成了现代星系的核心。
2026-06-25 09:27
绿电直连之所以能够从概念走向实践,离不开技术进步与产业协同的共同托举。随着市场机制与技术体系不断成熟,绿电直连有望从单点示范走向规模化网络发展,成为产业绿色转型的“新动脉”。
2026-06-25 09:32
加载更多