点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:趋境科技发布ATaaS:打造高效能AI Token生产服务平台
首页> 科技频道> 人工智能 > 正文

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

来源:光明网2026-03-27 18:09

  当前,人工智能产业正从模型能力竞争逐步转向规模化应用竞争,应用形态也从单一问答扩展到多智能体协作、长链路推理和复合任务执行,这使得Token需求快速增长。与此同时,算力采购、部署和运行过程中的设备和能源成本持续攀升,导致算力投入与实际Token产出之间的不匹配问题日益突出,围绕Token推理效率开展系统优化,已成为推动产业持续发展的关键环节。

  近日,全球领先的高效能AI Token生产服务商趋境科技,正式发布全新一代AI推理平台——趋境ATaaS高效能AI Token生产服务平台(Approaching.AI Token as a Service),旨在破解大额硬件投入难以转化为优质Token产能、资源浪费与成本空耗突出的行业困境。

  针对当前行业核心难题,趋境ATaaS平台依托四大自研核心技术模块,构建起覆盖异构整合、智能调度、弹性扩容的全链路能力,将算力与能源封装为分层、面向具体应用场景定制的高效能Token服务,为国产算力提质增效、破解异构算力孤岛、实现规模化降本增效,提供了标杆级中国方案。

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

  四大产业痛点凸显 硬件高投入难换高效Token产出

  当前AI产业发展中,Token生产领域面临四大突出困境,导致硬件高投入无法转化为高效Token产出,制约产业规模化发展:

  一是硬件负载分化,过度依赖GPU导致资源闲置空耗。传统Token生成链路重度依赖GPU,而CPU、大容量内存、集群SSD及IB高速互联等昂贵资源长期利用率不足10%,全系统硬件资源利用率不足20%,造成智算集群规模化刚性成本巨额空耗。

  二是软硬件迭代失衡,软件适配滞后拖累算力发挥。硬件标称算力虽持续提升,但软件层在通信、访存和算子融合等方面优化不足,PD/PP/CP/DP等分布式并行策略在复杂组合下稳定性有限,最终导致超80%理论算力难以充分利用。

  三是算力配置失准,粗放盲配引发资源冗余损耗。当前集群算力配置难以依据不同推理业务在时延、吞吐和稳定性上的差异化要求,精准匹配CPU、GPU、内存等异构资源,统一部署和粗放配额仍较常见,导致超过50%的算力资源被隐形浪费。

  四是架构演进失衡,拼接式集成难以支撑规模化生产。开源生态为大模型推理提供了丰富模块,但在大规模集群场景下,单靠组件拼接难以解决系统级协同问题,原生架构对KV Cache、序列长度等模型态关键参数感知不足,易引发负载失衡,叠加通信阻塞和服务波动等因素,系统扩展后常面临性能下降与运维复杂度上升,无法支持大规模高效能Token生产。

  四大核心技术破局 趋境ATaaS重构Token生产效能曲线

  趋境科技提供高效能Token的本质,是重构算力、电力与Token产量之间的效能曲线。ATaaS并非简单的资源供给平台,而是效能放大器——用软件撬动数倍于当前的Token产能,其四大自研核心技术精准破解行业痛点:

趋境科技发布ATaaS:打造高效能AI Token生产服务平台

  六合:异构推理2.0|全球首创大模型计算逻辑重构技术。深度融合CPU+GPU、国产与非国产算力异构PD分离等技术,重构模型计算逻辑,并基于算子与任务特征进行智能分流:CPU承载低计算密度任务,国产算力卡处理高密度Prefill,大显存显卡承载高访存Decode,可使万卡级智算集群整体运营成本压降20%以上。

  月饼:以存换算2.0|全球首创超体量KV Cache缓存技术。通过架构重构,将原本依赖昂贵显存承载的KV Cache存储空间扩展百倍至千倍,形成近乎无限的缓存池资源,缓存命中率最高可达90%,直接削减90% GPU算力开销。

  双仪:虚实同构|全球首创算子级SLO仿真。基于算子级精细仿真,推演大模型Token生成全链路的吞吐、时延与访存表现,实现算力资源的智能预规划与动态调优;围绕业务SLO分级需求,精准切分异构算力配额并隔离资源优先级,可将万卡级智算集群硬件综合资源利用率最高提升数倍。

  万象:极致弹性|打通规模化量产最后壁垒。依托系统化工程能力,实现万亿参数大模型7秒快速拉起与动态配置变更、数百节点超大规模EP弹性调度,以及智能容灾重构和负载均衡,形成平台原生支持万卡级高性能横向扩展的关键能力。在落地初期,便推动某在线公司的AI业务实现千卡集群吞吐翻倍提升。

  从“数据中心”到“Token工厂” 引领AI基础设施迭代升级

  趋境ATaaS高效能AI Token生产服务平台的发布,体现了AI基础设施发展重点的进一步演进。当前,行业关注的焦点正从单纯的算力规模竞争,转向对Token生产效率的综合衡量,其中包括Token响应延时(TTFT)、Token吞吐(TPS)以及资源利用效率等关键指标。

  这一理念与当前行业共识高度契合——当黄仁勋宣布NVIDIA的1万亿美元需求预测,当Token“供不应求”成为常态,算力基础设施正从“数据中心”演进为“Token工厂”。

  作为高效能AI Token生产服务商,趋境科技依托长期的团队积累和推理优化能力,推出趋境ATaaS平台的意义不仅在于拓展了推理基础设施的技术边界,更在于为AI基础设施的建设和运营提供了新的思路和行业标准:通过提升算力调度效率、优化推理过程、增强资源协同能力,使每单位算力和能耗投入都能够数倍转化为更稳定、更可衡量的Token价值产出,为AI产业规模化落地注入强劲动力。(战钊)

[ 责编:张佳兴 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 湖北:2.6万吨大桥成功转体

  • 山东莒县:阳光大课间 活力满校园

独家策划

推荐阅读
实际上本轮废旧手机回收价格上涨并非全品类普涨,不同品牌、型号、配置的废旧手机,涨幅存在显著差异。
2026-03-27 10:14
在博鳌亚洲论坛2026年年会上,一位特殊的嘉宾吸引了大家的目光——博鳌亚洲论坛史上首位数字人嘉宾ViviDora正式亮相。3月25日在博鳌亚洲论坛“人形机器人的进阶与飞跃”分论坛上拍摄的机器人。
2026-03-27 09:25
这些年,中国科技产出持续攀升——高被引论文数全球占比超30%,专利授权量连年位居世界第一。在技术经理人的“撮合”下,马鹏程团队成功在新疆、陕西、宁夏、内蒙古等地的煤化工企业完成前期中试。
2026-03-27 09:23
时间回到10年前,2016年11月15日凌晨3点,中国科学院青年创新促进会学术年会的酒店房间里,武延军与计算所研究员包云岗靠在各自的床头,越聊越兴奋。编译工具链、操作系统内核及关键基础组件等基础软件的适配,是指令集架构的生态底座,它们是所有硬件和应用软件绕不开的“基础设施”。
2026-03-27 09:35
3月26日,在中关村论坛年会—RISC-V生态科技论坛上,中国科学院正式公布在RISC-V关键技术突破、产业协同创新及人才培养领域的系列重要成果,集中发布“香山”开源处理器与“如意”原生操作系统两大重要成果,并正式启动下一代芯片与操作系统的联合研发工作。
2026-03-27 09:33
粤港澳大湾区核心枢纽工程狮子洋通道关键控制性工程——狮子洋大桥实现东、西主塔封顶,转入上部结构施工阶段。
2026-03-27 09:29
26日发布的《自然》增刊《2026自然指数—中国》显示,我国在自然指数中继续居于首位。与两年前发布的上一次《自然指数—中国》增刊(数据区间为2022年8月至2023年7月)相比,多个中国机构的全球排名显著提升。
2026-03-27 09:27
26日6时51分,我国在太原卫星发射中心使用长征二号丁运载火箭,成功将四维高景二号05、06星发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-03-27 09:25
全国科学技术名词审定委员会25日发布《关于发布试用人工智能领域名词token中文名“词元”的公告》,决定在综合考量社会各界意见建议的基础上,优先推荐“词元”作为人工智能领域名词token的中文名,并面向全社会发布试用。
2026-03-26 09:23
木卫二是一颗冰封的木星卫星,也是太阳系内最有希望孕育地外生命的地方。“欧罗巴快船”团队认为,他们将发现适宜生命生存的海洋,但除非探测器真正抵达、展开探测,没有人能给出确切的答案。
2026-03-26 09:24
作者:陆俊杰(南通大学副校长,江苏省习近平新时代中国特色社会主义思想研究中心特约研究员)  在促进创新链产业链资金链人才链深度融合、推动科技成果高效转化应用上探索新途径,是“十五五”时期江苏经济社会发展的重要目标任务。深耕“双高协同”不仅是破解科研创新与产业需求脱节的关键举措,更是落实创新驱动发展战略的重要布局。
2026-03-26 09:24
记者从中国发明协会获悉:在瑞士日内瓦举行的第五十一届日内瓦国际发明展上,中国代表团共获得90项金奖、95项银奖和52项铜奖。
2026-03-26 09:30
工业和信息化部25日公布,今年前2个月,我国通信业运行平稳,电信业务总量保持增长,5G、千兆光网、物联网等网络基础设施建设有序推进。截至2月末,5G基站总数达490.9万个,比上年末净增7万个,占移动基站总数的38%。
2026-03-26 09:24
3月25日,国家自然科学基金委员会在2026中关村论坛年会开幕式上发布2025年度“中国科学十大进展”,10项重大基础研究突破入选。界面调控新方法创制面向空天应用的高性能柔性叠层太阳能电池示意图 国家自然科学基金委员会供图 
2026-03-26 09:22
3月25日,以“创新与发展”为永久主题,由科技部、国家发展改革委、工业和信息化部、国务院国资委、中国科学院、中国工程院、中国科协和北京市政府共同主办的2026中关村论坛年会在北京拉开帷幕。
2026-03-26 09:21
记者24日从农业农村部获悉,农业农村部近日印发通知,督促指导各地依法严厉打击坑农害农、危害粮食安全和农产品质量安全违法行为,守护群众“舌尖上的安全”,持续夯实国家粮食安全根基。
2026-03-25 10:22
氢能兼具能源、资源、储能介质三重属性,氢能产业科技含量高、低碳属性强、发展空间大。通知提出到2030年,通过应用规模扩大,推动氢能应用技术、工艺、装备创新突破,实现燃料电池、电解槽、储运装置和材料等迭代升级,推动氢能成为新的经济增长点,支撑实现经济社会发展全面绿色转型。
2026-03-25 10:21
林间密密麻麻的印痕,正是东北虎豹国家公园生态环境越来越好的体现。在科技守护与不懈坚守下,东北虎豹国家公园的生态成果愈发显著:东北虎和东北豹的数量由公园试点初的27只和42只,增长至当前的70只和80只左右。
2026-03-25 10:11
国家卫生健康委和中国气象局24日联合发布首期全国花粉浓度预报服务提示,为公众提供精准防护指引。目前正值春季,以木本植物花粉传播为主,建议过敏人群及时关注本地花粉浓度和种类变化,必要时明确过敏原,提前做好防护和出行安排。
2026-03-25 10:04
自然资源部日前发布四川省冕宁县牦牛坪矿区稀土矿资源储量核实勘查项目成果,矿区新增稀土资源量966.6万吨。据悉,牦牛坪矿区稀土矿资源储量核实勘查项目还新增伴生萤石资源量2713.5万吨、伴生重晶石资源量3722.8万吨,均达到超大型规模,具有重大战略意义。
2026-03-25 10:00
加载更多