点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:趋境科技发布ATaaS:打造高效能AI Token生产服务平台
首页> 科技频道> 人工智能 > 正文

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

来源:光明网2026-03-27 18:09

  当前,人工智能产业正从模型能力竞争逐步转向规模化应用竞争,应用形态也从单一问答扩展到多智能体协作、长链路推理和复合任务执行,这使得Token需求快速增长。与此同时,算力采购、部署和运行过程中的设备和能源成本持续攀升,导致算力投入与实际Token产出之间的不匹配问题日益突出,围绕Token推理效率开展系统优化,已成为推动产业持续发展的关键环节。

  近日,全球领先的高效能AI Token生产服务商趋境科技,正式发布全新一代AI推理平台——趋境ATaaS高效能AI Token生产服务平台(Approaching.AI Token as a Service),旨在破解大额硬件投入难以转化为优质Token产能、资源浪费与成本空耗突出的行业困境。

  针对当前行业核心难题,趋境ATaaS平台依托四大自研核心技术模块,构建起覆盖异构整合、智能调度、弹性扩容的全链路能力,将算力与能源封装为分层、面向具体应用场景定制的高效能Token服务,为国产算力提质增效、破解异构算力孤岛、实现规模化降本增效,提供了标杆级中国方案。

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

  四大产业痛点凸显 硬件高投入难换高效Token产出

  当前AI产业发展中,Token生产领域面临四大突出困境,导致硬件高投入无法转化为高效Token产出,制约产业规模化发展:

  一是硬件负载分化,过度依赖GPU导致资源闲置空耗。传统Token生成链路重度依赖GPU,而CPU、大容量内存、集群SSD及IB高速互联等昂贵资源长期利用率不足10%,全系统硬件资源利用率不足20%,造成智算集群规模化刚性成本巨额空耗。

  二是软硬件迭代失衡,软件适配滞后拖累算力发挥。硬件标称算力虽持续提升,但软件层在通信、访存和算子融合等方面优化不足,PD/PP/CP/DP等分布式并行策略在复杂组合下稳定性有限,最终导致超80%理论算力难以充分利用。

  三是算力配置失准,粗放盲配引发资源冗余损耗。当前集群算力配置难以依据不同推理业务在时延、吞吐和稳定性上的差异化要求,精准匹配CPU、GPU、内存等异构资源,统一部署和粗放配额仍较常见,导致超过50%的算力资源被隐形浪费。

  四是架构演进失衡,拼接式集成难以支撑规模化生产。开源生态为大模型推理提供了丰富模块,但在大规模集群场景下,单靠组件拼接难以解决系统级协同问题,原生架构对KV Cache、序列长度等模型态关键参数感知不足,易引发负载失衡,叠加通信阻塞和服务波动等因素,系统扩展后常面临性能下降与运维复杂度上升,无法支持大规模高效能Token生产。

  四大核心技术破局 趋境ATaaS重构Token生产效能曲线

  趋境科技提供高效能Token的本质,是重构算力、电力与Token产量之间的效能曲线。ATaaS并非简单的资源供给平台,而是效能放大器——用软件撬动数倍于当前的Token产能,其四大自研核心技术精准破解行业痛点:

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

  六合:异构推理2.0|全球首创大模型计算逻辑重构技术。深度融合CPU+GPU、国产与非国产算力异构PD分离等技术,重构模型计算逻辑,并基于算子与任务特征进行智能分流:CPU承载低计算密度任务,国产算力卡处理高密度Prefill,大显存显卡承载高访存Decode,可使万卡级智算集群整体运营成本压降20%以上。

  月饼:以存换算2.0|全球首创超体量KV Cache缓存技术。通过架构重构,将原本依赖昂贵显存承载的KV Cache存储空间扩展百倍至千倍,形成近乎无限的缓存池资源,缓存命中率最高可达90%,直接削减90% GPU算力开销。

  双仪:虚实同构|全球首创算子级SLO仿真。基于算子级精细仿真,推演大模型Token生成全链路的吞吐、时延与访存表现,实现算力资源的智能预规划与动态调优;围绕业务SLO分级需求,精准切分异构算力配额并隔离资源优先级,可将万卡级智算集群硬件综合资源利用率最高提升数倍。

  万象:极致弹性|打通规模化量产最后壁垒。依托系统化工程能力,实现万亿参数大模型7秒快速拉起与动态配置变更、数百节点超大规模EP弹性调度,以及智能容灾重构和负载均衡,形成平台原生支持万卡级高性能横向扩展的关键能力。在落地初期,便推动某在线公司的AI业务实现千卡集群吞吐翻倍提升。

  从“数据中心”到“Token工厂” 引领AI基础设施迭代升级

  趋境ATaaS高效能AI Token生产服务平台的发布,体现了AI基础设施发展重点的进一步演进。当前,行业关注的焦点正从单纯的算力规模竞争,转向对Token生产效率的综合衡量,其中包括Token响应延时(TTFT)、Token吞吐(TPS)以及资源利用效率等关键指标。

  这一理念与当前行业共识高度契合——当黄仁勋宣布NVIDIA的1万亿美元需求预测,当Token“供不应求”成为常态,算力基础设施正从“数据中心”演进为“Token工厂”。

  作为高效能AI Token生产服务商,趋境科技依托长期的团队积累和推理优化能力,推出趋境ATaaS平台的意义不仅在于拓展了推理基础设施的技术边界,更在于为AI基础设施的建设和运营提供了新的思路和行业标准:通过提升算力调度效率、优化推理过程、增强资源协同能力,使每单位算力和能耗投入都能够数倍转化为更稳定、更可衡量的Token价值产出,为AI产业规模化落地注入强劲动力。(战钊)

[ 责编:张佳兴 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 寻童心 备高考

  • 山东曹县:发展芦笋产业 赋能乡村振兴

独家策划

推荐阅读
“九章四号”被应用于高效求解高斯玻色采样任务,其计算速度相比当前全球最快的超级计算机快1054倍(即量子优势比为1054),成功建立了国际上最强的量子计算优越性。
2026-05-15 03:15
夏粮收购是全年粮食收购的首战,对于保护种粮农民利益、维护粮食市场平稳运行、保障粮食稳定安全供给具有重要意义。
2026-05-15 03:25
5月14日,我国首座海上移动式多功能措施平台“海洋石油283”(又称“增产一号”)从青岛西海岸新区启运
2026-05-15 03:25
5月14日11时,朱雀二号改进型遥五运载火箭在东风商业航天创新试验区发射升空,运载火箭全程飞行正常,二子级进入预定轨道,飞行试验任务取得圆满成功。
2026-05-15 03:15
自然资源部13日发布的最新找矿成果显示,西藏罗布莎矿区新增铬铁矿资源量73.83万吨,实现矿山深边部找矿突破。找矿团队还在西藏东巧地区首次评价沉积型铬铁矿,新增伴生铬铁矿矿石量114.63万吨,拓展了我国铬铁矿找矿空间。
2026-05-15 02:55
中国科学技术大学潘建伟、陆朝阳、张强、刘乃乐等组成的研究团队联合国内多家科研单位,成功研制出1024个量子压缩态输入、8176模式的可编程量子计算原型机“九章四号”。
2026-05-14 09:49
当前,全球科技创新格局深度调整,科技成果转化已成为衡量国家创新体系效能的关键标尺。
2026-05-14 03:05
中国人对天宇的想象,自古便深沉而浪漫。在东华大学,科研人员将来自38万公里外的月球土壤化为一缕缕兼具柔性与强度的星际之丝。
2026-05-14 02:40
近日,中国科学院化学研究所研究员乔燕、王树团队联合国内外科学家,首次实现人工细胞的形态与功能不对称分裂,为理解类生命功能涌现和原始细胞形成提供了新路径。
2026-05-14 02:40
近日,国家网信办、国家发展改革委、工业和信息化部联合印发《智能体规范应用与创新发展实施意见》(以下简称《实施意见》),明确支持探索智能体在城市规划、建设与治理环节的规范应用,同时将智能体安全、可靠、可信作为产业发展的底线要求。
2026-05-14 02:25
“请帮我检索南京附近适合亲子旅游的路线”“我想买个电热水器,请帮我推荐几款实用的”……如今,越来越多的消费者开始将AI(人工智能)当作“随身消费参谋”。从规划旅游路线到挑选酒店民宿,再到日常购物选择,很多消费者习惯先问一问AI工具,再做消费决策。
2026-05-13 09:30
在这一过程中,颠覆性技术正由潜在变量转变为关键变量,成为重塑产业结构、重构竞争格局的重要力量。颠覆性技术具有“路径替代”特征,能够深刻改变产业格局。综上所述,未来产业发展呈现出“技术跃迁—场景转化—工程化扩张”的基本路径。
2026-05-13 09:22
搭载单核180个计算比特自主超导量子芯片的“本源悟空-180”量子计算机已上线运行,开始接收全球量子计算任务。
2026-05-13 02:30
2018年,厦大教师吴彩胜带着一群厦大青年来到这里。他们发现,当地的农副产品虽然产量不小,却因缺乏检测条件,面临“好产品难认证”的困境。
2026-05-13 02:20
浦江潮涌,惠风和畅。5月12日,第十二届亚太经合组织(APEC)食品安全合作论坛(FSCF)会议在上海举行。
2026-05-13 02:25
今年5月12日是第18个全国防灾减灾日,主题是“人人讲安全、个个会应急——提高防灾减灾救灾能力”。
2026-05-12 02:40
习近平总书记在加强基础研究座谈会上强调,基础研究是整个科学体系的源头,是所有技术问题的总机关。
2026-05-12 02:40
当前,我国正处于加快建设教育强国的关键时期。教育作为强国建设、民族复兴之基,战略地位更加凸显,迎来了前所未有的发展机遇
2026-05-12 02:40
十年来,北京大学考古文博学院坚守初心、守正创新,聚焦学科、学术、话语、育人四大体系一体化建设,并以实践创新贯穿始终,让四者协同赋能
2026-05-12 02:40
回顾人类社会发展史可以发现,任何一个国家的崛起都伴随着思想文化的兴盛和知识体系的自主建构。
2026-05-12 02:40
加载更多