点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:数据中心计算体系架构创新实现重要突破
首页> 科技频道> 创新创业 > 正文

数据中心计算体系架构创新实现重要突破

来源:光明网2023-08-15 17:47

  当前,数字化、智能化转型已成为企业发展、科研创新和社会治理的刚性需求,也催生了云计算、大数据、人工智能等数字技术的蓬勃发展。然而,越来越多样化的应用对底层硬件资源的需求存在差异,导致使用传统架构的云、数、智、边、端等各类技术平台彼此独立,硬件资源难以共享复用,造成资源浪费的同时也使得运维管理难度激增。

  比如,以大模型为代表的AIGC技术需要基于海量数据集,在拥有成百上千AI加速卡的集群上对千亿级参数的AI大模型进行分布式训练,对异构算力的需求更高;科学计算要求更高的计算精度,对通用算力的需求更高;内存计算则希望让更多应用程序的数据驻留在内存之中,使得数据和算力更接近,以提高处理速率,对内存容量要求更高。但传统架构下,IT资源的扩展是以整机形态来完成的,即便用户亟需的是某种特定资源,但仍然需要为整机附带的额外资源付费,这势必增加了IT支出并造成资源闲置浪费。

  与此同时,在算力供给侧摩尔定律逐渐放缓和登纳德缩放定律走向终结,现有的计算体系架构先天性不足被成倍放大,数据中心计算体系架构的创新已迫在眉睫。浪潮信息服务器产品线总经理赵帅表示,“当前数据中心遇到的‘内存墙’、‘I/O墙’、‘功耗墙’等现象,并不是孤立存在,它们是现有计算体系架构不足放大后的体现。只有通过计算体系架构的整体创新,才能彻底解决各种瓶颈带来的挑战。”

  日前,浪潮信息正式推出融合架构3.0原型系统,以开创性的系统架构设计实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,支持池化资源异步升级、支持细粒度多主机共享高并发存储、亚微秒级远端内存共享访问等特性,可通过软件定义实现“一套系统,N类应用”,有效缓解当前数据中心 “内存墙”、“I/O墙”、“功耗墙”等瓶颈。

  融合架构3.0原型系统的发布,将有望发展出一种全解耦、全池化、高可扩展、易部署、易管理的新型硬件基础架构,实现软硬高度协同,加速数据中心释放数字生产力,促进数字经济发展以及与实体经济的深度融合。

  据介绍,该系统打破了以往“以CPU为中心”的设计理念,从整体出发,通过系统架构创新解耦重构服务器系统,突破性实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,可支持多种通用处理器平台与GPU、FPGA、DPU等多种异构加速单元的协同计算,并可通过软件定义实现资源协同动态调度。

  这种基于硬件重构技术而开发的新一代基础架构,将实现更加自由的资源随需定义,为上层软件定义系统提供更出色的灵活性,使其能够根据应用特点,以高度自动化的方式分配与重新配置硬件资源,不再受到非动态设置的硬件基础设施的限制,让数据中心内部的人工智能、科学计算、云计算、大数据等各类应用统一运行于同一架构之上,实现多技术平台融合,加速业务创新及数字化转型。

  与传统的CPU为中心的计算架构不同,融合架构3.0原型系统以数据为中心,实现计算节点内部各种算力芯片共享内存数据、统一编址和协同工作;在跨节点之间则通过智能数据处理单元和高速网络形成分布式互连交换,实现CPU、GPU、FPGA等各种加速芯片的算力协同以及内存池化、新型存储资源池化,具有节点间的数据访问延迟极低,支持高效弹性扩展等优势。此外,融合架构系统可以实现更为灵活的资源重构,为人工智能、大数据等多种应用场景提供强大的算力支撑。

  内存解耦与池化一直是业界的热点与难点,随着以CXL为代表的串行缓存一致性总线的出现,给主机和远端共享内存之间提供了低延时的访问路径以及缓存一致性保证,为大规模内存扩展与内存资源池化提供了可能。融合架构3.0原型系统突破内存解耦池化关键技术,研制新型应用串行缓存一致性总线及其交换技术的内存模组和内存池化系统,保障主机系统对大容量、高带宽内存的应用需求。

  赵帅介绍,融合架构3.0原型系统首创JBOM独立内存资源池设计,创新实现高密度内存扩展方案,主机系统远端内存扩展技术领先业界。通过软件定义系统设计及CXL高性能交换技术,率先实现内存资源池化与细粒度多主机共享。

  系统互连设计方面,解耦与池化带来了新的互连挑战,整系统通过设计供电控制、复位、时钟锁定等协同工作方式实现解耦单元整体运行。此外,随着数据速率的不断攀升和系统链路变得更加复杂,解耦池化系统互连链路互连延展已经接近极限,系统针对复杂链路高速互连进行高精度的拟合仿真研究,准确分析系统互连链路多样化拓扑和传输速率的极限。

  此外,融合架构3.0原型系统开发软件定义管理系统,实现拓扑切换、端口动态管理、多主机资源共享与资源动态分区等高级功能;开发资源管理软件,实现设备利用率监控、设备分配情况配置与管理、I/O吞吐量监控和链路健康诊断,保障主机系统硬件资源的动态部署与高效管理。

  赵帅表示,“融合架构3.0原型系统效率可比上一代软件虚拟化系统提升一到两个数量级,可扩展性提高2-4倍,系统延时降低90%,PUE低于1.1。随着数字经济、人工智能持续发展,企业的各项业务越来越依赖数据及其价值,算力技术也需要不断演进,融合架构3.0原型系统的发布,有助于企业提升数据管理效率,最大化释放数据价值。”(柯岩)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 第二十一届文博会闭幕

  • “国门铁路”警察守护旅客平安路

独家策划

推荐阅读
“黑夜给了我黑色的眼睛,我却用它寻找光明。”
2025-05-27 13:22
“世界杰出女科学家奖”由联合国教科文组织和法国欧莱雅基金会在1998年联合设立
2025-05-27 11:10
无法释放起落架的民航客机在巨大的摩擦声中以机腹着地方式从跑道上滑过,高速进入大气层的空天飞机像一个“火球”剧烈燃烧,大型运输机在超强暴风雪中艰难起飞,先进战斗机在复杂空战环境中被导弹碎片打得千疮百孔……
2025-05-27 09:27
近日,中国科学院广州地球化学研究所副研究员高名迪与研究员王煜、中国科学院院士徐义刚,以及澳大利亚国立大学教授Stephen Foley合作,通过高温高压实验与超深金刚石包裹体成分对比研究,揭示了再循环碳酸盐如何改变地幔氧化还原状态,及对克拉通演化和深部碳循环的影响。
2025-05-27 09:22
“浚澜”船配备了高压岸电接入模块,可以采用全电力驱动挖掘系统,实现施工作业零碳排放。
2025-05-27 09:16
天问二号探测器按计划完成了技术区总装、测试、加注、转场、功能检查、联合测试等工作。
2025-05-27 09:10
研究发现,自20世纪80年代以来,北半球高纬地区大气甲烷浓度的季节振幅呈现减弱趋势,而副热带及热带地区的季节振幅却显著增强。这一变化趋势及其空间差异为解析全球甲烷源汇的长期演变提供了关键观测证据,为全球甲烷减排提供了科学支撑。
2025-05-27 09:09
据两位消息人士透露,英伟达还在为中国开发另一款采用Blackwell架构的芯片,最早可能于9月开始生产。
2025-05-26 12:51
研究人员成功诱导干细胞发育成充满液体的羊膜囊。这种模型囊体直径约2厘米,相当于一个4周胚胎周围羊膜囊的实际大小,可用于研究早期妊娠。
2025-05-26 09:21
你有过牙齿酸酸胀胀的体验吗?这会让我们真切地感受到牙齿有多敏感。其实,在咀嚼食物时,这种敏感性大有用处,它能提供关于温度、压力,还有疼痛方面的重要信息。
2025-05-26 09:18
最新一期《自然》杂志发表的论文报告发现一个原以为“不可能存在”的神秘结构。
2025-05-26 09:18
阿尼玛卿雪山保存着50余条冰川,年均径流量占黄河上游总流量35%,其变化对黄河流域水资源具有重要影响。
2025-05-26 09:16
如今,在各地田间地头,植保无人机凌空起舞、无人拖拉机破土前行、水肥一体精准施肥、北斗导航精准播种、智能机器人全天候巡检……科技感十足的农耕图景随处可见。
2025-05-26 09:15
可持续的减肥从不靠极端节食,而是科学的生活习惯。
2025-05-23 13:30
邓宏章对此形象地比喻:“传统LNP像‘硬闯城门’的士兵,难免伤及无辜;而TNP则是‘和平访问’的来客,以最小代价达成使命。”
2025-05-23 13:13
加强统筹协调,健全部际协同、央地协作、区域合作的工作机制,创新体制机制,加大政策支持,加强统计监测,深化开放合作,着力提升科技服务业发展环境。
2025-05-23 13:50
以“矢志创新发展,建设科技强国”为主题的第九个全国科技工作者日系列活动将于近期陆续开展。
2025-05-23 13:01
这一发现对恒星演化理论、致密星吸积物理和双星并合引力波源研究具有重要意义。
2025-05-23 08:01
若不采取紧急行动,到2030年,全球至少半数青少年(超10亿人)将生活在健康风险高发的“多重负担国家”,面临HIV感染、早孕、抑郁、营养不良等多重威胁。
2025-05-23 09:13
中国科学技术大学生命科学与医学部薛天、马玉乾团队与国内外科研机构合作,制备出高透明、高转化效率的上转换隐形眼镜,可实现人类近红外时空色彩图像视觉能力。相关研究成果5月22日在线发表在国际期刊《细胞》上。
2025-05-23 08:55
加载更多