点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:数据中心计算体系架构创新实现重要突破
首页> 科技频道> 创新创业 > 正文

数据中心计算体系架构创新实现重要突破

来源:光明网2023-08-15 17:47

  当前,数字化、智能化转型已成为企业发展、科研创新和社会治理的刚性需求,也催生了云计算、大数据、人工智能等数字技术的蓬勃发展。然而,越来越多样化的应用对底层硬件资源的需求存在差异,导致使用传统架构的云、数、智、边、端等各类技术平台彼此独立,硬件资源难以共享复用,造成资源浪费的同时也使得运维管理难度激增。

  比如,以大模型为代表的AIGC技术需要基于海量数据集,在拥有成百上千AI加速卡的集群上对千亿级参数的AI大模型进行分布式训练,对异构算力的需求更高;科学计算要求更高的计算精度,对通用算力的需求更高;内存计算则希望让更多应用程序的数据驻留在内存之中,使得数据和算力更接近,以提高处理速率,对内存容量要求更高。但传统架构下,IT资源的扩展是以整机形态来完成的,即便用户亟需的是某种特定资源,但仍然需要为整机附带的额外资源付费,这势必增加了IT支出并造成资源闲置浪费。

  与此同时,在算力供给侧摩尔定律逐渐放缓和登纳德缩放定律走向终结,现有的计算体系架构先天性不足被成倍放大,数据中心计算体系架构的创新已迫在眉睫。浪潮信息服务器产品线总经理赵帅表示,“当前数据中心遇到的‘内存墙’、‘I/O墙’、‘功耗墙’等现象,并不是孤立存在,它们是现有计算体系架构不足放大后的体现。只有通过计算体系架构的整体创新,才能彻底解决各种瓶颈带来的挑战。”

  日前,浪潮信息正式推出融合架构3.0原型系统,以开创性的系统架构设计实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,支持池化资源异步升级、支持细粒度多主机共享高并发存储、亚微秒级远端内存共享访问等特性,可通过软件定义实现“一套系统,N类应用”,有效缓解当前数据中心 “内存墙”、“I/O墙”、“功耗墙”等瓶颈。

  融合架构3.0原型系统的发布,将有望发展出一种全解耦、全池化、高可扩展、易部署、易管理的新型硬件基础架构,实现软硬高度协同,加速数据中心释放数字生产力,促进数字经济发展以及与实体经济的深度融合。

  据介绍,该系统打破了以往“以CPU为中心”的设计理念,从整体出发,通过系统架构创新解耦重构服务器系统,突破性实现了计算资源、存储资源、内存资源、异构加速资源等核心IT资源彻底解耦与池化,可支持多种通用处理器平台与GPU、FPGA、DPU等多种异构加速单元的协同计算,并可通过软件定义实现资源协同动态调度。

  这种基于硬件重构技术而开发的新一代基础架构,将实现更加自由的资源随需定义,为上层软件定义系统提供更出色的灵活性,使其能够根据应用特点,以高度自动化的方式分配与重新配置硬件资源,不再受到非动态设置的硬件基础设施的限制,让数据中心内部的人工智能、科学计算、云计算、大数据等各类应用统一运行于同一架构之上,实现多技术平台融合,加速业务创新及数字化转型。

  与传统的CPU为中心的计算架构不同,融合架构3.0原型系统以数据为中心,实现计算节点内部各种算力芯片共享内存数据、统一编址和协同工作;在跨节点之间则通过智能数据处理单元和高速网络形成分布式互连交换,实现CPU、GPU、FPGA等各种加速芯片的算力协同以及内存池化、新型存储资源池化,具有节点间的数据访问延迟极低,支持高效弹性扩展等优势。此外,融合架构系统可以实现更为灵活的资源重构,为人工智能、大数据等多种应用场景提供强大的算力支撑。

  内存解耦与池化一直是业界的热点与难点,随着以CXL为代表的串行缓存一致性总线的出现,给主机和远端共享内存之间提供了低延时的访问路径以及缓存一致性保证,为大规模内存扩展与内存资源池化提供了可能。融合架构3.0原型系统突破内存解耦池化关键技术,研制新型应用串行缓存一致性总线及其交换技术的内存模组和内存池化系统,保障主机系统对大容量、高带宽内存的应用需求。

  赵帅介绍,融合架构3.0原型系统首创JBOM独立内存资源池设计,创新实现高密度内存扩展方案,主机系统远端内存扩展技术领先业界。通过软件定义系统设计及CXL高性能交换技术,率先实现内存资源池化与细粒度多主机共享。

  系统互连设计方面,解耦与池化带来了新的互连挑战,整系统通过设计供电控制、复位、时钟锁定等协同工作方式实现解耦单元整体运行。此外,随着数据速率的不断攀升和系统链路变得更加复杂,解耦池化系统互连链路互连延展已经接近极限,系统针对复杂链路高速互连进行高精度的拟合仿真研究,准确分析系统互连链路多样化拓扑和传输速率的极限。

  此外,融合架构3.0原型系统开发软件定义管理系统,实现拓扑切换、端口动态管理、多主机资源共享与资源动态分区等高级功能;开发资源管理软件,实现设备利用率监控、设备分配情况配置与管理、I/O吞吐量监控和链路健康诊断,保障主机系统硬件资源的动态部署与高效管理。

  赵帅表示,“融合架构3.0原型系统效率可比上一代软件虚拟化系统提升一到两个数量级,可扩展性提高2-4倍,系统延时降低90%,PUE低于1.1。随着数字经济、人工智能持续发展,企业的各项业务越来越依赖数据及其价值,算力技术也需要不断演进,融合架构3.0原型系统的发布,有助于企业提升数据管理效率,最大化释放数据价值。”(柯岩)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “五一”假期文旅热

  • 京广铁路整修忙

独家策划

推荐阅读
近年来,国产科幻影视剧《流浪地球2》和《三体》火热“出圈”,获得全球关注。
2024-04-30 03:05
酚醛树脂是人类历史上第一种人工合成塑料,自诞生以来已经历了一个世纪。
2024-04-30 03:05
近日,云南农业大学盛军、田洋教授课题组突破核桃油抗氧化难题,研发出替代植脂末的核桃植物基奶粉,并实现成果转化和应用,相关研究成果在国际期刊《食品工程学报》发表。
2024-04-30 03:05
有一个名字,总是让人心生自豪——广袤大地纵横驰骋,“流动的中国”以最直观的方式,将“中国速度”呈现给世界。
2024-04-30 03:05
在2024中关村论坛年会“人工智能主题日”活动现场,多项人工智能领域前沿技术、数据要素、生态培育、产教融合、场景应用、监管治理等多方面成果精彩亮相,百余位人工智能领域专家围绕大模型、具身智能、可信AI等国内外前沿热点话题展开讨论。
2024-04-30 03:05
光明日报教育周刊近期推出的《科学教育提质正当时》系列报道,从师资培养、课程设置、资源建设等多方面,对如何更好进行中小学科学教育展开了持续讨论,并提出了一系列推动科学教育发展的有效建议,在科学界、科学教育界引发热议。
2024-04-30 03:30
“中国共有独角兽企业369家。《中国独角兽企业发展报告(2024年)》由中关村独角兽企业发展联盟联合毕马威企业咨询(中国)有限公司、长城战略咨询、北京方迪经济发展研究院、清华大学中国科技政策研究中心共同发布。
2024-04-29 10:09
截至目前,神舟十七号航天员乘组已完成全部既定任务,将于4月30日乘坐神舟十七号载人飞船返回东风着陆场。
2024-04-29 10:07
2024年3月5日,习近平总书记在参加十四届全国人大二次会议江苏代表团审议时强调,要牢牢把握高质量发展这个首要任务,因地制宜发展新质生产力。 以创新为核心,通过技术创新、管理创新和模式创新,提升生产力整体水平,推动航空产业加快发展。
2024-04-29 10:06
以前,铸钛大炉坩埚容易损坏,需要每月更换一次,公司每年需要投入不少资金购买新坩埚。我和设备专家一起夜以继日地攻关,终于编制出了一套新的铸钛炉熔炼操作法,提高了坩埚使用率,每年可节约坩埚费用50万元左右。
2024-04-29 10:05
2024成都世园会开幕以来,邛崃分会场龙门山生物多样性博览园迎来游客参观热。 借着成都世园会的契机,成都梳理整合龙门山生物多样性资源,规划建设了占地1172亩的龙门山生物多样性博览园,无边界地呈现龙门山生物多样性。
2024-04-29 10:04
令张治国兴奋的是,武王墩一号墓椁室盖板上已发现和采集墨书文字100多句、近千字,是典型的楚系文字。“对于南方潮湿环境下考古出土的丝绸保护而言,从饱水到干燥的过程,可以说是生死攸关。
2024-04-28 10:23
对此,《指导意见》明确了依法合规管理数据资产、明晰数据资产权责关系、完善数据资产相关标准、加强数据资产使用管理、稳妥推动数据资产开发利用等12方面主要任务。该负责人表示,为加强数字资产管理,《指导意见》突出以下基本原则:  坚持确保安全与合规利用相结合。
2024-04-28 10:19
为落实碳达峰碳中和目标,我国将应对气候变化作为国家战略,纳入生态文明建设整体布局和经济社会发展全局,加强顶层设计。
2024-04-28 10:17
复旦大学邯郸校区的一个小院里,藏着一件“镇院神器”——上海电子束离子阱装置。
2024-04-28 10:04
4月19日,元阳县沙拉托乡松树寨村的村民在哈尼梯田开展春耕播种。(张艳 摄)  在元阳县沙拉托乡的哈尼梯田缓冲区,当地举行“开秧门”活动,村民们在田间地头祈福,他们载歌载舞,迎接春耕的到来。
2024-04-28 10:03
研究人员表示,马岭河小苦荬的发现,表明兴义世界地质公园具有丰富的生物多样性,值得开展进一步系统性的调查研究。
2024-04-28 09:59
从1999年起,有着“神箭”称号的长二F火箭全程参与了中国载人航天工程“三步走”战略的每一步。它用100%的成功率,为航天员搭建出一条安全“天梯”。
2024-04-26 09:33
近期,人工智能(AI)+机器人赛道广受关注。尤翔宇表示,梳理人形机器人产业技术发展脉络,主要有底层硬件、运动控制和具身智能3条路线。优必选相关负责人表示,未来,公司将聚焦人形机器人的三大应用场景,包括工业制造、商用服务和家庭陪伴。
2024-04-26 09:41
加载更多