点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统
首页> 科技频道> 综合新闻 > 正文

AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统

来源:光明网2025-09-26 21:39

  光明网讯 9月26日,在2025人工智能计算大会上,浪潮信息宣布,基于元脑SD200超节点AI服务器,DeepSeek R1大模型token生成速度仅需8.9毫秒,创造国内大模型最快token生成速度。最新发布的元脑HC1000超扩展AI服务器,实现每百万token成本首次击破1元。

AI推理进入“10毫秒、1块钱”时代!浪潮信息发布面向智能体优化AI计算系统

  随着Scaling Law持续推动模型能力跃升,以DeepSeek为代表的开源模型极大降低了创新门槛,加速智能体产业化的到来。智能体产业化的核心三要素是能力、速度和成本。其中,模型能力决定了智能体的应用上限,交互速度决定了智能体的商业价值,token成本决定了智能体的盈利能力。

  浪潮信息对AI计算架构的持续创新,旨在解决智能体产业化面临的交互速度和token成本两大瓶颈,为多智能体协同与复杂任务推理的规模化落地,提供高速度、低成本的算力基础设施。

  仅需8.9毫秒!元脑SD200引领token生成速度率先进入“10毫秒时代”

  浪潮信息最新公布,基于元脑SD200超节点AI服务器运行DeepSeek R1大模型,单token生成速度低至8.9毫秒,带动国内AI服务器token生成速度率先进入“10毫秒时代”。

  元脑SD200基于创新研发的多主机低延迟内存语义通信架构,在单机内实现了64路本土AI芯片的高速统一互连,单机可承载4万亿参数单体模型,或部署多个万亿参数模型组成的智能体应用,实现多模型协同执行复杂任务。

  为实现极低的通信延迟,元脑SD200采用精简高效的三层协议栈,原生支持多种内存语义操作,避免冗余数据拷贝,将基础通信延迟降至百纳秒级,硬件化链路层重传与分布式预防式流控进一步适配高吞吐、低延迟的 AI 推理场景。

  元脑HC1000,推理成本首次击破1元/每百万token

  浪潮信息发布元脑HC1000超扩展AI服务器,基于全新开发的全对称DirectCom极速架构,无损超扩展设计聚合海量本土AI芯片、支持极大推理吞吐量,推理成本首次击破1元/每百万token,为智能体突破token成本瓶颈提供极致性能的创新算力系统。

  元脑HC1000通过全面优化降本和软硬协同增效,创新16卡计算模组设计、单卡“计算-显存-互连”均衡设计,大幅降低单卡成本和每卡系统分摊成本。同时,全对称的系统拓扑设计支持超大规模无损扩展。据测算,元脑HC1000通过算网深度协同、全域无损技术,实现推理性能相比传统RoCE提升1.75倍,单卡模型算力利用率最高提升5.7倍。

  未来,智能体带来的推理算力需求将呈现出指数级的爆发式增长。浪潮信息方面透露,将通过软硬件协同设计与深度优化,持续推动AI计算架构的创新与突破,不断实现token生成“提速降本”,积极促进大模型、智能体等人工智能技术与实体经济的深度融合,让人工智能成为千行百业的生产力和创新力。(记者 战钊)

[ 责编:焦子原 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 夜迎“双十一”

  • 大理崇圣寺三塔安装避雷装置

独家策划

推荐阅读
在数据管理与使用方面,《实施方案》提出,实行物流公共数据分类分级管理,规范开展数据授权运营,扩大路网、轨迹、企业、人员等关键数据供给。
2025-11-11 10:03
中国科协日前发布的《中国科技期刊发展蓝皮书(2025)》显示,我国科技期刊总量持续增加,从2023年的5211种提升至2024年的5325种,整体影响力稳步提升。
2025-11-11 10:04
空天地一体化网络作为国家信息化的重要基础设施,其战略意义远超普通通信技术范畴,它不仅是我国实现信息全球覆盖、自主创新的必由之路,更是在数字时代掌握发展主动权的关键布局。
2025-11-11 10:02
拔尖创新人才培养不是考验瞬间爆发力的短跑,而是需要长期持久力的马拉松。 在课程体系搭建上,北航实验学校打造了“五级阶梯式”科技创新人才贯通培养课程群,实现从基础普及到进阶的无缝衔接。
2025-11-11 10:00
日前,国务院办公厅印发《关于加快场景培育和开放推动新场景大规模应用的实施意见》(以下简称《意见》),对相关工作作出部署。
2025-11-11 09:50
11月9日,国航C919重飞“两航起义”航线主题航班从香港飞抵天津,重温76年前“两航起义”的北飞航程,致敬“两航起义”爱国壮举。“两航”后代陈绍曾介绍,76年前,“两航起义”飞行员从香港驾驶12架飞机飞抵北京、天津,建设新中国民航事业。
2025-11-10 10:10
“超级细菌”指那些对多种抗生素具有耐药性的细菌。研究人员在一种常用药物的生产流程中意外发现一种很有前景的强效抗生素,能够杀死耐甲氧西林金黄色葡萄球菌等“超级细菌”。
2025-11-10 10:09
11月9日,2025年世界互联网大会乌镇峰会在浙江乌镇闭幕。世界互联网大会秘书长任贤良用“聚焦构建网络空间命运共同体理念”“关注创新发展热点议题”“不断擦亮峰会品牌”“持续贡献智慧力量”概括了本届峰会的特点。
2025-11-10 10:08
使用供暖设备有哪些注意事项?一起来看!
2025-11-10 10:17
我们将围绕推进新型工业化人才需求,顺应实体经济和数字经济融合发展趋势,立足产业需求侧职责定位,多措并举加快推动制造业技能人才队伍建设。深入开展产业基础再造工程、制造业数字化转型行动等,依托项目培养高技能人才。
2025-11-10 10:07
ASC26报名链接:https://www.asc-events.net/StudentChallenge/ASC26/Register.php
2025-11-07 15:58
北京时间2025年11月6日11:00—14:00,地磁发生强烈扰动,达到大地磁暴水平(Kp=7),为橙色警报级别。
2025-11-07 13:39
阿特拉斯的成功观测是天问一号的一次重要拓展任务,利用探测器观测暗弱天体为天问二号开展小行星探测进行了技术试验,积累了经验
2025-11-07 09:37
天问一号环绕器利用高分辨率相机近日成功观测到星际天体——阿特拉斯。”据介绍,天问一号探测器于2021年2月进入火星环绕轨道,迄今已稳定运行4年8个月,目前状态良好。
2025-11-07 09:31
与会嘉宾围绕“人工智能+”深度融入产业创新发展等话题进行深入探讨,凝聚产业国际合作发展共识,推动构建开放包容的人工智能产业创新生态。
2025-11-07 09:29
谈及人形机器人何时能从“炫技”转向应用落地,优必选科技副总裁焦继超提出了分阶段的发展预期。中国电子学会机器人分会青年副主任委员、乐聚智能(深圳)股份有限公司董事长冷晓琨表示,预计明年人形机器人在工业领域会出现采购交付数量过万台的企业。
2025-11-07 09:28
“十四五”时期,我们将目光投向脑疾病领域,通过脑机接口技术,实现了“诊断—监测—治疗—预测”一体的大脑实时“观景”。一方面,脑机接口技术可以让神经系统“说话”,通过高精度解码神经信号实现对大脑的“意念读取”和精准诊断。
2025-11-07 09:18
遥远恒星大气爆发活动的起源区域有哪些特征,人类至今知之甚少。但科学家们正在通过分析太阳爆发活动,探究恒星大气爆发活动的奥秘。
2025-11-06 10:35
这几年,子午工程已经有不少应用场景。例如在航天员出舱时,提前进行空间天气预报,避免在太阳风暴来临、空间有高能粒子时出舱,保护航天员健康安全。
2025-11-06 10:34
智能穿戴设备产品形态从手环、手表延伸至耳机、眼镜、戒指等形式,新供给创造新需求,改变了消费者生活方式,推动着健康管理、时尚消费与技术创新的深度融合。
2025-11-06 10:32
加载更多