点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统
首页> 科技频道> 综合新闻 > 正文

AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统

来源:光明网2025-09-26 21:39

  光明网讯 9月26日,在2025人工智能计算大会上,浪潮信息宣布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒,创造国内大模型最快token生成速度。最新发布的元脑HC1000超扩展AI服务器,实现每百万token成本首次击破1元。

AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统

  随着Scaling Law持续推动模型能力跃升,以DeepSeek为代表的开源模型极大降低了创新门槛,加速智能体产业化的到来。智能体产业化的核心三要素是能力、速度和成本。其中,模型能力决定了智能体的应用上限,交互速度决定了智能体的商业价值,token成本决定了智能体的盈利能力。

  浪潮信息对AI计算架构的持续创新,旨在解决智能体产业化面临的交互速度和token成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。

  仅需8.9毫秒!元脑SD200引领token生成速度率先进入“10毫秒时代”

  浪潮信息最新公布,基于元脑SD200超节点AI服务器运行DeepSeek R1大模型,单token生成速度低至8.9毫秒,带动国内AI服务器token生成速度率先进入“10毫秒时代”。

  元脑SD200基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。

  为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。

  元脑HC1000,推理成本首次击破1元/每百万token

  浪潮信息发布元脑HC1000超扩展AI服务器,基于全新开发的全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token,为智能体突破token成本瓶颈提供极致性能的创新算力系统。

  元脑HC1000通过全面优化降本和软硬协同增效,创新16卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。

  未来,智能体带来的推理算力需求将呈现出指数级的爆发式增长。浪潮信息方面透露,将通过软硬件协同设计与深度优化,持续推动AI计算架构的创新与突破,不断实现token生成“提速降本”,积极促进大模型、智能体等人工智能技术与实体经济的深度融合,让人工智能成为千行百业的生产力和创新力。(记者 战钊)

[ 责编:焦子原 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 习近平出席新疆维吾尔自治区成立70周年庆祝大会

  • 新疆维吾尔自治区成立70周年庆祝大会在乌鲁木齐举行

独家策划

推荐阅读
各地情况不同,建设“无废城市”也需因地制宜,但认准了,就要坚定不移干下去,直到干出成效、达到既定目标。
2025-09-26 09:39
黄芪五仁月饼、茯苓陈皮豆沙月饼、“五行月饼”……中秋将至,主打“药食同源”的药膳月饼受到许多人青睐,成为节日消费新亮点。药膳月饼选用的食材,如茯苓健脾宁心、莲子益肾固涩、薏仁利水渗湿,都是常见食疗材料,适量食用有一定调理效果。
2025-09-26 09:38
国家疾控局近日举行新闻发布会。该局新闻发言人、综合司一级巡视员熊煌介绍,目前,病媒生物传染病、自然疫源性传染病风险处于较高水平,手足口病、诺如病毒感染等肠道传染病聚集性疫情风险增加,流感等其他急性呼吸道传染病处于低水平。
2025-09-26 09:37
广西壮族自治区博物馆藏品管理和展览部副主任黄海荣介绍,广西素有“铜鼓之乡”的美誉,2006年,壮族铜鼓习俗入选第一批国家级非物质文化遗产名录。在全国科普月期间,重庆邮电大学空间通信研究院科普基地展台前,一场趣味十足的“芯片探秘”正在上演。
2025-09-26 09:35
中共中央政治局常委、国务院副总理丁薛祥23日在湖南调研。他强调,要深入学习贯彻习近平总书记在湖南考察时的重要讲话精神,以科技创新引领产业创新,加快培育和发展新质生产力,打造国家重要先进制造业高地。
2025-09-26 04:30
“十四五”以来,我国能源科技在全产业链取得新成效,能源科技创新取得更大突破。数智技术不断助力能源创新升级,绿色低碳能源技术开发能力不断增强。
2025-09-26 04:30
随着人工智能技术的迅猛发展和广泛应用,人工智能已成为各国经济社会发展的重要推动力,也是当前国际竞争的新焦点。以习近平同志为核心的党中央高度重视人工智能发展,不断完善顶层设计、加强工作部署,推动我国人工智能综合实力整体性、系统性跃升。
2025-09-26 04:30
眼下正值全国科普月,25日,科学家精神百场讲坛走进成都炭材公司,中国工程院院士、高功率脉冲技术及应用专家邱爱慈作题为《马兰精神与强脉冲辐射环境模拟技术》的主题报告。
2025-09-26 04:30
据中国载人航天工程办公室消息,根据计划安排,神舟二十号航天员乘组将于近日择机实施第四次出舱活动。目前,空间站组合体运行稳定,神舟二十号航天员乘组状态良好,已做好出舱活动各项准备工作。
2025-09-25 09:46
开展安全生产治本攻坚三年行动,把排查整治重大事故隐患作为防范重特大事故最直接、最有效的手段,推动出台64项重大事故隐患判定标准。“‘十四五’以来,我们实施了提升社会消防安全能力、提升公众消防安全素质等重大工程,消防安全风险防控体系进一步完善,消防治理模式向事前预防进一步转型。
2025-09-25 09:46
当前,全球正经历以人工智能(AI)等新技术为代表的第四次工业革命,AI正以前所未有的速度和广度渗透到人类生产生活的各个领域。从全球范围来看,美国、日本、法国等国家积极探索AI引领零售创新,形成了各具特色的创新实践,具有一定借鉴意义。
2025-09-25 09:46
与此同时,我国算力资源布局进一步优化,全国一体化算力网加快构建,已初步形成枢纽节点、区域中心、本地边缘梯次化布局架构。“未来,要持续深化一体化算力网建设,夯实‘算存运’底座,强化算力资源统筹协同与动态优化能力,加速推动基础设施绿色升级。
2025-09-25 09:45
科学技术,既是人工智能(AI)理论和技术发展的源头和基础,也是人工智能的使用者、被影响者。尽管有这样那样的问题,但伦理规则设计与“人工智能+”同行甚至先行,是我们的目标,是AI健康发展的必要生态。
2025-09-25 09:41
科学探索奖由腾讯出资、新基石科学基金会运营,目标是支持中国顶尖的青年科学家,每名获奖人将连续5年获得总计300万元奖金。
2025-09-24 09:09
实验数据印证了这一点:在-18℃下,经过脉冲磁场处理的鲜湿米粉,冻融后的质构品质比未经处理的样品提升了30%—40%。
2025-09-24 09:07
科研人员经过研究,打造出高准确度基因组预测模型,该模型像“基因组导航仪”,通过全基因组关联分析找到控制关键性状的基因遗传变异,这些遗传变异犹如“基因路标”,能精准预测油菜生长表现。
2025-09-24 09:06
9月23日,第25届中国国际工业博览会在国家会展中心(上海)开幕。本届工博会以“工业新质 智造无界”为主题,吸引来自全球28个国家和地区的近3000家企业参展。
2025-09-24 04:15
工业和信息化部23日公布,今年前8个月,我国通信业呈现平稳运行态势,电信业务收入保持正增长,新型基础设施建设有序推进,5G、千兆、物联网等用户规模持续扩大,移动互联网接入流量保持较快增势。
2025-09-24 04:15
记者陈晨22日从水利部获悉,全国耕地灌溉面积达10.86亿亩,2025年耕地灌溉面积上夏粮产量占全国夏粮总产量的88.85%。截至目前,我国节水灌溉工程面积已达6.38亿亩,较“十三五”末提高12.5%,其中,滴灌、微喷灌面积突破1亿亩,耕地灌溉亩均用水量降至342立方米,较“十三五”末降低4%。
2025-09-23 10:18
9月23日,我们迎来第八个“中国农民丰收节”。今年4月,中共中央、国务院印发《加快建设农业强国规划(2024-2035年)》,就推动种业自主创新全面突破作出多项部署,为推动我国种业振兴指明了方向。
2025-09-23 10:16
加载更多