点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:趋境科技发布ATaaS:打造高效能AI Token生产服务平台
首页> 科技频道> 人工智能 > 正文

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

来源:光明网2026-03-27 18:09

  当前,人工智能产业正从模型能力竞争逐步转向规模化应用竞争,应用形态也从单一问答扩展到多智能体协作、长链路推理和复合任务执行,这使得Token需求快速增长。与此同时,算力采购、部署和运行过程中的设备和能源成本持续攀升,导致算力投入与实际Token产出之间的不匹配问题日益突出,围绕Token推理效率开展系统优化,已成为推动产业持续发展的关键环节。

  近日,全球领先的高效能AI Token生产服务商趋境科技,正式发布全新一代AI推理平台——趋境ATaaS高效能AI Token生产服务平台(Approaching.AI Token as a Service),旨在破解大额硬件投入难以转化为优质Token产能、资源浪费与成本空耗突出的行业困境。

  针对当前行业核心难题,趋境ATaaS平台依托四大自研核心技术模块,构建起覆盖异构整合、智能调度、弹性扩容的全链路能力,将算力与能源封装为分层、面向具体应用场景定制的高效能Token服务,为国产算力提质增效、破解异构算力孤岛、实现规模化降本增效,提供了标杆级中国方案。

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

  四大产业痛点凸显 硬件高投入难换高效Token产出

  当前AI产业发展中,Token生产领域面临四大突出困境,导致硬件高投入无法转化为高效Token产出,制约产业规模化发展:

  一是硬件负载分化,过度依赖GPU导致资源闲置空耗。传统Token生成链路重度依赖GPU,而CPU、大容量内存、集群SSD及IB高速互联等昂贵资源长期利用率不足10%,全系统硬件资源利用率不足20%,造成智算集群规模化刚性成本巨额空耗。

  二是软硬件迭代失衡,软件适配滞后拖累算力发挥。硬件标称算力虽持续提升,但软件层在通信、访存和算子融合等方面优化不足,PD/PP/CP/DP等分布式并行策略在复杂组合下稳定性有限,最终导致超80%理论算力难以充分利用。

  三是算力配置失准,粗放盲配引发资源冗余损耗。当前集群算力配置难以依据不同推理业务在时延、吞吐和稳定性上的差异化要求,精准匹配CPU、GPU、内存等异构资源,统一部署和粗放配额仍较常见,导致超过50%的算力资源被隐形浪费。

  四是架构演进失衡,拼接式集成难以支撑规模化生产。开源生态为大模型推理提供了丰富模块,但在大规模集群场景下,单靠组件拼接难以解决系统级协同问题,原生架构对KV Cache、序列长度等模型态关键参数感知不足,易引发负载失衡,叠加通信阻塞和服务波动等因素,系统扩展后常面临性能下降与运维复杂度上升,无法支持大规模高效能Token生产。

  四大核心技术破局 趋境ATaaS重构Token生产效能曲线

  趋境科技提供高效能Token的本质,是重构算力、电力与Token产量之间的效能曲线。ATaaS并非简单的资源供给平台,而是效能放大器——用软件撬动数倍于当前的Token产能,其四大自研核心技术精准破解行业痛点:

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

  六合:异构推理2.0|全球首创大模型计算逻辑重构技术。深度融合CPU+GPU、国产与非国产算力异构PD分离等技术,重构模型计算逻辑,并基于算子与任务特征进行智能分流:CPU承载低计算密度任务,国产算力卡处理高密度Prefill,大显存显卡承载高访存Decode,可使万卡级智算集群整体运营成本压降20%以上。

  月饼:以存换算2.0|全球首创超体量KV Cache缓存技术。通过架构重构,将原本依赖昂贵显存承载的KV Cache存储空间扩展百倍至千倍,形成近乎无限的缓存池资源,缓存命中率最高可达90%,直接削减90% GPU算力开销。

  双仪:虚实同构|全球首创算子级SLO仿真。基于算子级精细仿真,推演大模型Token生成全链路的吞吐、时延与访存表现,实现算力资源的智能预规划与动态调优;围绕业务SLO分级需求,精准切分异构算力配额并隔离资源优先级,可将万卡级智算集群硬件综合资源利用率最高提升数倍。

  万象:极致弹性|打通规模化量产最后壁垒。依托系统化工程能力,实现万亿参数大模型7秒快速拉起与动态配置变更、数百节点超大规模EP弹性调度,以及智能容灾重构和负载均衡,形成平台原生支持万卡级高性能横向扩展的关键能力。在落地初期,便推动某在线公司的AI业务实现千卡集群吞吐翻倍提升。

  从“数据中心”到“Token工厂” 引领AI基础设施迭代升级

  趋境ATaaS高效能AI Token生产服务平台的发布,体现了AI基础设施发展重点的进一步演进。当前,行业关注的焦点正从单纯的算力规模竞争,转向对Token生产效率的综合衡量,其中包括Token响应延时(TTFT)、Token吞吐(TPS)以及资源利用效率等关键指标。

  这一理念与当前行业共识高度契合——当黄仁勋宣布NVIDIA的1万亿美元需求预测,当Token“供不应求”成为常态,算力基础设施正从“数据中心”演进为“Token工厂”。

  作为高效能AI Token生产服务商,趋境科技依托长期的团队积累和推理优化能力,推出趋境ATaaS平台的意义不仅在于拓展了推理基础设施的技术边界,更在于为AI基础设施的建设和运营提供了新的思路和行业标准:通过提升算力调度效率、优化推理过程、增强资源协同能力,使每单位算力和能耗投入都能够数倍转化为更稳定、更可衡量的Token价值产出,为AI产业规模化落地注入强劲动力。(战钊)

[ 责编:张佳兴 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “核心价值观百场讲坛”走进江苏南京

  • 舰耀香江:人民海军舰艇赴港影像志

独家策划

推荐阅读
在6月27日举行的首届西部商业航天大会现场,陕西西安高新区管委会主任陈辉端着一台银灰色的火箭发动机模型走向发布台。“我们要实现星箭总体环节的突破,大力引进培育卫星总体、火箭总体企业,支持卫星智能制造工厂和商业火箭总装线建设。
2026-06-30 10:01
近日,“共和国勋章”获得者、我国著名水稻专家袁隆平相关话题上了热搜。袁隆平带领我国科研工作者,通过雄性不育遗传工具,攻克了利用杂种优势的世界性难题,创建了系统化、原创性的杂交水稻育种体系,开辟出利用水稻杂种优势的新道路,有力保障了国家粮食安全。
2026-06-30 10:01
国家能源局29日发布数据显示,今年1至5月,全国累计完成电力市场交易电量30573亿千瓦时,同比增长24.8%。1至5月,从交易范围看,省内交易电量24361亿千瓦时,同比增长28.5%;跨省跨区交易电量6212亿千瓦时,同比增长12.2%。
2026-06-30 10:01
教育、科技、人才是全面建设社会主义现代化国家的基础性、战略性支撑。在资源配置方面,需要强化规划衔接、政策协同,推动教育、科技、产业等多部门资源在人才培养这一共同目标下统筹配置。
2026-06-30 10:00
今年入夏以来,雷电、暴雨、大风等强对流天气轮番登场,其瞬间释放的破坏力令人心生畏惧。若身处人流密集区域,同行人不牵手,应立即进入安装有防雷装置的建筑物、金属车身的汽车等安全区域。
2026-06-30 10:00
美国核能初创企业Antares宣布,其在爱达荷国家实验室安装的小型模块化核反应堆“Mark-0”首次测试达到临界状态,成为特朗普政府发布加速核电发展行政命令以来,第一个突破这一门槛的新型反应堆设计。
2026-06-29 09:43
目前,油田油水井、站库的数字化覆盖率已分别超过97%和93%,物联网将油气生产的每一个末梢都纳入了智慧之网。
2026-06-29 09:41
中国共产党党员、中国工程院院士、著名金属材料专家、华中科技大学教授崔崑同志,因病医治无效,于2026年6月26日在武汉逝世,享年101岁。
2026-06-29 09:40
科学家成功把一束在纳米尺度下被高度囚禁的光,变成了一把能感知原子级形变的超级“尺子”,对材料内部埋藏的微小变形实现了无损探测。
2026-06-29 09:40
27日,国家重大科技基础设施“聚变堆主机关键系统综合研究设施”最大的超导部件——环向场磁体在安徽省合肥市完成最后制备工艺,并通过专家验收。
2026-06-29 09:37
当地时间24日,世界气象组织在日内瓦为中国工程院院士、中国气象局卫星气象专家许健民颁发第七十届国际气象组织奖,表彰他为天气预报、卫星气象事业以及气象业务服务作出的卓越贡献。
2026-06-26 09:28
来自英国伦敦国王学院与加拿大麦克马斯特大学衍生公司Block Biosciences等机构的科学家,正在研制一类靶向IMPDH2酶的候选药物。团队已设计并合成了数百种靶向IMPDH2的候选药物,正从中层层筛选最优化合物,力争尽快推向临床开发。
2026-06-26 09:26
6月25日,以“弘扬伟大抗疫精神 走好疾控新长征路”为主题的2026年“我和我的疾控故事”宣讲会在中国疾病预防控制中心举办。中国疾病预防控制中心性病艾滋病预防控制中心综合防治与政策室主任单多的故事,要从一双生了冻疮的手讲起。
2026-06-26 09:23
届链博会期间,贸促智库交流活动暨全球供应链报告与指数发布会在京举办。2018—2025年,促进指数、连接指数、创新指数、韧性指数均呈上行态势,表明全球供应链继续朝着更具韧性、更有效率、更富活力的方向发展。
2026-06-26 09:20
需要看到,保护耕地是推进乡村全面振兴、建设宜居宜业和美乡村的重要组成部分,广大农民是保护耕地的重要行动主体。
2026-06-26 09:19
卢宇彤介绍,“灵晟”依托国产高性能CPU、片上高带宽内存、高速互连网络、高吞吐存储、三维浮动正交、全液冷散热等多项核心技术创新打造。如今,面向科学、工程、产业各领域的大规模应用需求,“灵晟”提供多学科、全流程、多精度融合的科学智能应用生产级平台。
2026-06-25 09:36
日内瓦时间6月24日,中国工程院院士许健民从世界气象组织秘书长塞莱丝特·绍洛手中郑重接过第70届国际气象组织奖奖章。作为我国气象卫星事业的开拓者、见证者,许健民的身影,也是中国气象人实干创新、勇攀高峰的生动写照。
2026-06-25 09:33
在中国与泰国联合倡议下,世界贸易组织信息技术协定委员会23日举办专题研讨会,围绕信息技术协定支持人工智能就绪及包容性数字化转型展开探讨。
2026-06-25 09:32
如果它们真的是宇宙中的某种全新的事物,将改变我们对宇宙的认知,正如20世纪60年代类星体(星系中心进食的黑洞)的发现彻底革新了星系演化理论一样。”  无论直接坍缩理论是否正确,小红点都可能是超大质量黑洞的前身,后者构成了现代星系的核心。
2026-06-25 09:27
绿电直连之所以能够从概念走向实践,离不开技术进步与产业协同的共同托举。随着市场机制与技术体系不断成熟,绿电直连有望从单点示范走向规模化网络发展,成为产业绿色转型的“新动脉”。
2026-06-25 09:32
加载更多