点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计
首页> 科技频道> 创新创业 > 正文

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

来源:光明网2025-08-07 18:28

  当前,开源模型正取得飞跃式进步,推动研发范式从封闭走向开放协作。随着大模型参数量的持续提升,对算力基础设施的建设提出了更高要求。8月7日,浪潮信息发布面向万亿参数大模型的超节点AI服务器“元脑SD200”。该产品基于浪潮信息创新研发的多主机低延迟内存语义通信架构,以开放系统设计向上扩展支持64路本土GPU芯片。

  据介绍,元脑SD200可实现单机内运行超万亿参数大模型,并支持多个领先大模型机内同时运行及多智能体实时协作与按需调用,目前已率先实现商用。在实际评测中,元脑SD200运行DeepSeek R1和Kimi K2等全参模型的64卡整机推理性能实现超线性扩展。浪潮信息通过开放系统架构创新,为开源大模型的规模化落地和应用创新提供关键支撑。

浪潮信息发布“元脑SD200”超节点,面向万亿参数大模型创新设计

  随着混合专家模型(MoE)的高效架构驱动大模型参数规模持续扩展,国内外前沿大模型的参数量快速突破万亿规模,这给算力系统架构提出新的挑战。一方面,模型参数量增加和序列长度增加带来的键值缓存(KV cache)激增,需要智能计算系统具有超大显存空间承载,依靠单芯片或节点的性能提升已难以为继;且其推理过程作为通信敏感型计算,对分布式计算通信延时要求极高,需要构建更大向上扩展(Scale up)高速互连域。另一方面,智能体AI开启多模型协作的新范式,其推理过程需要生成比传统模型多近百倍的数据词元(token),导致计算量激增。

  元脑SD200超节点AI服务器是浪潮信息面向万亿参数大模型AI时代而设计,创新研发多主机低延迟内存语义通信架构,基于开放总线交换技术构建,在单机内实现了64路GPU芯片的高速统一互连,成功解决万亿大模型对超大显存空间和超低通信延时的核心需求。在开放架构之上,元脑SD200通过智能总线管理和开放的预填充-解码(Prefill-Decoder)分离推理框架实现软硬件深度协同,智能化管理复杂AI计算任务。

  在架构层面,元脑SD200基于自主研发的开放总线交换技术首创多主机三维网格系统架构,实现64路本土GPU芯片高速互连;通过创新远端GPU虚拟映射技术,突破多主机交换域统一编址难题,实现显存统一地址空间扩增8倍,单机可以提供最大4TB显存和64TB内存,为万亿参数、超长序列大模型提供充足键值缓存空间。同时,依托百纳秒级超低延迟链路,构建64卡大高速互连域统一原生内存语义通信,实测结果表明,在推理过程常见的小数据包通信场景中,全规约(All Reduce)性能表现优异,显著提升计算与通信效率。

  在系统层面,根据万亿参数大模型计算、通信需求特征,浪潮信息开发智能总线管理系统,实现超节点64卡全局最优路由的自动创建,支持不同拓扑切换,资源按需切分。对于全规约、全聚集(All Gather)等典型通信算子,开展不同数据量大小的细粒度通信策略设计,如多层级通信机制等,实现通信延时进一步降低。同时依托开放的PD分离框架,支持异步KV Cache高效传输与差异化并行策略,在提升业务服务级别目标的同时保持对多元算力的兼容性,实现计算与通信架构的深度协同优化。

  元脑SD200超节点AI服务器通过软硬协同系统创新,成功向上扩展突破芯片性能边界,在大模型场景中展示出优异的性能表现。结合优化的PD分离框架,SD200超节点满机运行DeepSeek R1全参模型推理性能超线性提升比为3.7倍,满机运行Kimi K2全参模型推理性能超线性提升比为1.7倍。 (战钊)

[ 责编:王若昕 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平春节前夕慰问部队

  • 世界最长海底高铁隧道建设施工稳步推进

独家策划

推荐阅读
一纸锦旗山水间,杏林春暖绿意长。
2026-02-12 11:01
金星与地球大小相近,同样诞生于太阳系内侧,却有着截然不同的命运。
2026-02-12 09:41
科技部十司相关负责同志解读《调查处理规定》。
2026-02-12 09:38
《细胞》封面:猕猴屏状核细胞分类与全脑联接图谱。在当前脑图谱大科学计划研究目标迈进绘制非人灵长类介观脑图谱的关键阶段,中国科学家仍在进一步集聚全球力量,持续扩大“朋友圈”。
2026-02-12 09:25
据悉,在战略上,植物星球计划还将整体提升全球生物多样性保护和实现碳中和的生态能力,构建植物科学领域全球大科学命题国际合作的新格局。
2026-02-12 09:17
马年将至,作为一种兼具力量与速度的动物,马正受到格外的关注。
2026-02-12 09:12
工业和信息化部等五部门近日印发《关于加强信息通信业能力建设支撑低空基础设施发展的实施意见》。加强监管能力体系建设,规划无人机专用号段,推动“一机一码一号”能力建设,探索标识解析在无人机领域的应用,形成无人机通信资源精细化管理。
2026-02-11 09:25
全球森林逐渐被快生树木主导,而稳定生态系统的慢生树种正在消失。“我们关注的是极为独特的物种,它们主要集中在生物多样性丰富、生态系统联系紧密的热带和亚热带地区。“此外,在现在和未来受到干扰的地区,非本地物种可能会加剧对光、水和养分的竞争,从而使本地树木更难生存。
2026-02-11 09:32
中国科学院动物研究所研究员王红梅带领的“灵长类胚胎发育的规律解析与体外模拟团队”,用27年的接力攻坚,把灵长类早期胚胎发育这个看不见、摸不着的“黑匣子”,变成了清晰可见的“生命剧本”。
2026-02-11 09:32
截至1月28日,“横竖都是世界第一”的贵州花江峡谷大桥累计接待游客突破130万人次,通行车辆超20万辆次,持续为区域发展注入新动能。大桥带来的发展溢出效应令人瞩目,而深入大桥肌理探查,你会发现,支撑起这座庞然大物的每根细钢丝,全部都是“中国造”。
2026-02-11 09:31
针对常见的饮食误区,杨爱明特别提醒,不建议采用“不吃主食”或“用水果代替主食”的方法来控制体重。对于肠胃功能较弱的人群,应避免过冷、过烫、过辣、过咸食物的刺激,切忌暴饮暴食,并尽量保持规律的进餐时间,以防加重原有胃肠问题。
2026-02-11 09:24
近日,市场监管总局(国家标准委)批准发布《中医体质分类与判定》推荐性国家标准。
2026-02-10 09:44
聚集相关企业300余家,机器人产业链规模超百亿元……北京亦庄,为何扎堆这么多机器人企业?
2026-02-10 09:42
“十四五”时期,我国全社会研发经费投入年均增长10%,研发经费投入强度提高0.44个百分点。
2026-02-10 09:41
日前,我科研团队在国际学术期刊《科学》发表论文《多尺度泛基因组图谱赋能混合倍性甘蔗的基因组解析》,为甘蔗高产优质育种提供了全新“基因资源地图”与核心分析工具。
2026-02-10 09:34
日前,南海区域海-气双向耦合智能大模型“飞鱼-1.0”在广东广州正式发布。“
2026-02-10 09:33
蓝天、绿林、碧水、清波……冬日的广东东莞松山湖科学城,温暖、惬意。
2026-02-09 10:00
这声呼唤,穿越漫长岁月,凝结着人类对这位地球近邻永恒的好奇与梦想。而今,随着新一轮探月热潮在全球兴起,这句“去月球”已不再仅仅是浪漫的诗意表达,更成为科技前沿竞相追逐、国家实力与创新精神交汇的生动实践。
2026-02-09 09:57
特种机器人技术与数智系统创新团队成员张平点击一键启动指令后,雷达驱动、定位算法、规划与控制算法等模块被加载。在系统支持下,无人机能够精准定位、自主导航与实时避障,像一位不知疲倦的巡检员。
2026-02-09 09:53
深耕西南高原山区二十余载,于富强与真菌为伴,在种质资源保护与产业富民之间架起桥梁,把论文写进泥土中,把科研做进农户的大棚里。3年间,于富强往返昆明与水城数十趟,硬是帮着水城从零起步,建成了食用菌研究所、日产50万袋的菌种厂和鲜菇冷链物流集散中心。
2026-02-09 09:53
加载更多