点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计
首页> 科技频道> 创新创业 > 正文

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

来源:光明网2025-08-07 18:28

  当前,开源模型正取得飞跃式进步,推动研发范式从封闭走向开放协作。随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。

  据介绍,元脑SD200可实现单机内运行超万亿参数大模型,并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,目前已率先实现商用。在实际评测中,元脑SD200运行DeepSeek R1和Kimi K2等全参模型的64卡整机推理性能实现超线性扩展。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

  随着混合专家模型(MoE)的高效架构驱动大模型参数规模持续扩展,国内外前沿大模型的参数量快速突破万亿规模,这给算力系统架构提出新的挑战。一方面,模型参数量增加和序列长度增加带来的键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。

  元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。

  在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

  在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

  元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。 (战钊)

[ 责编:王若昕 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 包银高铁包惠段进入运行试验阶段

  • 广西三江:风雨桥上遇非遗

独家策划

推荐阅读
目前,我国专业技术人才超过8000万人,技能劳动者总量超过2.2亿人,其中高技能人才超过7200万人,为推动高水平科技自立自强、建设现代化产业体系提供了坚实人才支撑。
2025-09-28 09:45
9月27日20时40分,我国在太原卫星发射中心使用长征六号改运载火箭,成功将卫星互联网低轨11组卫星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。
2025-09-28 09:39
今天,横跨贵州省贞丰县与关岭县的世界第一高桥——六安高速花江峡谷大桥正式建成通车。大桥通车后,原来需要绕行2小时的花江峡谷两岸贞丰县至关岭县,如今仅需2分钟即可直达,真正实现了“天堑变通途”。
2025-09-28 09:39
近日,2025亚太机器人世界杯青岛国际邀请赛在青岛西海岸新区举行,来自12个国家和地区的84支代表队同台竞技。在各类比赛中,人形机器人足球赛吸引了最多观众“观战”。
2025-09-28 04:15
9月27日03时28分,我国在酒泉卫星发射中心使用长征四号丙运载火箭,成功将风云三号08星发射升空,卫星顺利进入预定轨道,发射任务获得圆满成功。
2025-09-28 04:15
为改善数字消费“硬设施”和“软环境”,近日,商务部联合国家发展改革委、工业和信息化部等7部门研究出台《关于大力发展数字消费共创数字时代美好生活的指导意见》。
2025-09-28 04:15
各地情况不同,建设“无废城市”也需因地制宜,但认准了,就要坚定不移干下去,直到干出成效、达到既定目标。
2025-09-26 09:39
黄芪五仁月饼、茯苓陈皮豆沙月饼、“五行月饼”……中秋将至,主打“药食同源”的药膳月饼受到许多人青睐,成为节日消费新亮点。药膳月饼选用的食材,如茯苓健脾宁心、莲子益肾固涩、薏仁利水渗湿,都是常见食疗材料,适量食用有一定调理效果。
2025-09-26 09:38
国家疾控局近日举行新闻发布会。该局新闻发言人、综合司一级巡视员熊煌介绍,目前,病媒生物传染病、自然疫源性传染病风险处于较高水平,手足口病、诺如病毒感染等肠道传染病聚集性疫情风险增加,流感等其他急性呼吸道传染病处于低水平。
2025-09-26 09:37
广西壮族自治区博物馆藏品管理和展览部副主任黄海荣介绍,广西素有“铜鼓之乡”的美誉,2006年,壮族铜鼓习俗入选第一批国家级非物质文化遗产名录。在全国科普月期间,重庆邮电大学空间通信研究院科普基地展台前,一场趣味十足的“芯片探秘”正在上演。
2025-09-26 09:35
中共中央政治局常委、国务院副总理丁薛祥23日在湖南调研。他强调,要深入学习贯彻习近平总书记在湖南考察时的重要讲话精神,以科技创新引领产业创新,加快培育和发展新质生产力,打造国家重要先进制造业高地。
2025-09-26 04:30
“十四五”以来,我国能源科技在全产业链取得新成效,能源科技创新取得更大突破。数智技术不断助力能源创新升级,绿色低碳能源技术开发能力不断增强。
2025-09-26 04:30
随着人工智能技术的迅猛发展和广泛应用,人工智能已成为各国经济社会发展的重要推动力,也是当前国际竞争的新焦点。以习近平同志为核心的党中央高度重视人工智能发展,不断完善顶层设计、加强工作部署,推动我国人工智能综合实力整体性、系统性跃升。
2025-09-26 04:30
眼下正值全国科普月,25日,科学家精神百场讲坛走进成都炭材公司,中国工程院院士、高功率脉冲技术及应用专家邱爱慈作题为《马兰精神与强脉冲辐射环境模拟技术》的主题报告。
2025-09-26 04:30
据中国载人航天工程办公室消息,根据计划安排,神舟二十号航天员乘组将于近日择机实施第四次出舱活动。目前,空间站组合体运行稳定,神舟二十号航天员乘组状态良好,已做好出舱活动各项准备工作。
2025-09-25 09:46
开展安全生产治本攻坚三年行动,把排查整治重大事故隐患作为防范重特大事故最直接、最有效的手段,推动出台64项重大事故隐患判定标准。“‘十四五’以来,我们实施了提升社会消防安全能力、提升公众消防安全素质等重大工程,消防安全风险防控体系进一步完善,消防治理模式向事前预防进一步转型。
2025-09-25 09:46
当前,全球正经历以人工智能(AI)等新技术为代表的第四次工业革命,AI正以前所未有的速度和广度渗透到人类生产生活的各个领域。从全球范围来看,美国、日本、法国等国家积极探索AI引领零售创新,形成了各具特色的创新实践,具有一定借鉴意义。
2025-09-25 09:46
与此同时,我国算力资源布局进一步优化,全国一体化算力网加快构建,已初步形成枢纽节点、区域中心、本地边缘梯次化布局架构。“未来,要持续深化一体化算力网建设,夯实‘算存运’底座,强化算力资源统筹协同与动态优化能力,加速推动基础设施绿色升级。
2025-09-25 09:45
科学技术,既是人工智能(AI)理论和技术发展的源头和基础,也是人工智能的使用者、被影响者。尽管有这样那样的问题,但伦理规则设计与“人工智能+”同行甚至先行,是我们的目标,是AI健康发展的必要生态。
2025-09-25 09:41
科学探索奖由腾讯出资、新基石科学基金会运营,目标是支持中国顶尖的青年科学家,每名获奖人将连续5年获得总计300万元奖金。
2025-09-24 09:09
加载更多