点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:黄仁勋说的“推理拐点”,AI初创企业准备好了吗?
首页> 科技频道> 公司焦点 > 正文

黄仁勋说的“推理拐点”,AI初创企业准备好了吗?

来源:光明网2026-03-28 12:46

  GTC 2026大会上,黄仁勋断言:“推理拐点已至。”

  他给出了两个惊人的数字,过去两年推理所需的计算量增长了约1万倍,使用量增长了100倍。

  数字背后,揭示了一个行业共识:大模型竞争正在从“训练驱动”走向“持续推理”。“推理算力激增”变得不再是一个技术现象,它甚至开始重塑AI企业的生存法则。

  过去,算力是一次性投入——训练完模型,大头就花完了。但推理时代完全不同:每一次用户请求、每一次Agent执行任务,背后都是算力消耗。

  这也意味着,算力供给、成本控制、推理能效比等,正成为影响企业应用落地、商业回报的关键因素。

  对于头部科技公司,他们尚能通过规模优势、自建集群和长期采购降低算力成本。但对于绝大多数AI初创企业来说,他们原本就面临着现金流脆弱、商业模式未验证等生存困境,推理拐点的到来,反而带来了新的压力与挑战。

  算力这道难题,究竟该怎么破解?

  01推理时代,AI初创企业面临的四大痛点

  痛点1:推理算力,一场持续性失血的成本之战

  相比于传统的对话框聊天,Agent可自主拆解任务、调用模型/工具/接口、完成全流程,一次任务动辄消耗高达十万至百万级Token。

  更关键的是,Agent存在智能自主与持续进化两大特性,这意味着算力消耗从“阶段性投入”转变为“持续性支出”,只要业务在运转,推理成本就会不断叠加。

  对于商业模式尚未完全跑通的初创企业而言,推理成本无疑成为了最大的财务黑洞。

  痛点2:算力短缺,一卡难求

  算力的稀缺性,在推理时代被进一步放大。当前,全球GPU供应链持续面临地缘政治与产能双重约束。而有限的算力资源则往往优先倾斜给战略合作伙伴,初创公司即便愿意支付溢价获得算力,也可能在等待中眼睁睁错失市场窗口。

  痛点3:缺人缺经验,GPU“用不满”

  就算有了获取算力的渠道,真正决定推理效率与成本的是算力的运维与优化能力。而AI初创企业由于资源和资金相对有限,缺乏专业的工程团队与长期的实战积累,导致效率上不去,GPU用不“满”,资源白白浪费。

  痛点4:供给弹性不足,服务僵化

  推理负载天然具有峰谷波动特征。但在传统的固定算力配置模式下,企业不可避免地陷入“算力浪费”陷阱:按峰值配置,非高峰期大量算力闲置浪费;按均值配置,高峰一来服务就崩。

  02商汤大装置全栈能力,让算力“用得起、拿得到、用得好”

  对初创企业来说,算力困局的本质不只是价格问题,更是能力问题。商汤大装置作为“最懂大模型的AI基础设施”,帮助初创企业一次性打通这个系统性难题,让算力“用得起、拿得到、用得好”。

  (1)弹性扩缩容,全链路推理全面降本

  商汤大装置提供高度弹性的算力供给机制,支持初创企业根据业务负载的实时变化动态调整算力规模,彻底摆脱固定配置模式下的资源闲置与峰值不足两难困境。算力成本与业务规模精准同步,让企业每一分钱都花在刀刃上。

  依托商汤大装置平台的智能化统一调度能力,通过监测系统实时抓取业务指标,根据推理业务扩缩容规则自动分配资源,实现算力与流量的精准匹配;同时,通过“按需扩缩容 + 定时扩缩容”的双重机制,在低峰期自动缩减资源、高峰期秒级扩容,显著提升整体弹性与资源利用效率。

  另外,在推理侧,商汤大装置同时支持开源vLLM与自研LightLLM双推理引擎,通过基础设施与模型协同优化(PD分离、通信计算折叠、FP8强化、算子优化等),把推理性能“榨”到极致。

  (2)多元异构算力混训,打破供给瓶颈

  面对高端算力供给集中、初创企业采购困难的市场现状,商汤大装置系统性推动国产算力从“能用”走向“好用”,截止到目前,已经与20+款国产芯片完成国产化适配,并率先实现万卡国产GPU集群大规模异构混训,算力利用率高达80%,效率达同构训练的95%,成功突破单一GPU供给限制,推动国产算力规模化商用,为初创企业提供更具性价比的算力选择。

  (3)完善的供应链体系,护航业务全程可信

  在供应链安全层面,商汤大装置逐渐搭建起完善的、全方位、多层级软件供应链安全防护与管理体系,确保产品全生命周期安全与可信。近期,商汤大装置SenseCore原生AI云平台通过工业和信息化部电子工业标准化研究院组织的软件供应链安全能力评估,获评优秀级,成为全国首批通过该项认证的企业。

  (4)贴身陪跑,把商汤AI实战经验直接赋能给你

  商汤始终站在AI技术演进的前沿,经过近十余年的持续发展,完成了从AI 1.0到AI 2.0的跨越,积累下丰厚的实战经验,现在我们将“从实验室到产业”的完整经验,整合成“4S”全周期赋能体系开放给合作伙伴:

  Solution(联合解决方案):基于商汤多模态大模型与行业洞察,共同打造可落地的AI解决方案。

  Sales(联合销售):通过商汤的客户网络与渠道,帮助创新企业触达产业客户,推动商业化落地。

  Service(全周期专家服务):提供从技术架构、模型优化到场景适配的全流程专家支持。

  Strategic Partnership(算力支持与战略协同):提供免费算力资源,并在投融资、生态资源等方面开展长期赋能和支持。

  03众多标杆案例,可参考的实战路径

  智象未来×商汤大装置:“三板斧”,跑出全球首个开放使用视频生成DiT模型

  智象未来,凭借在生成式AI和多模态领域的技术积累迅速响应,仅用短短2个月时间便推出全球首个上线开放使用的图像和视频生成(DiT)架构模型,并迅速在vivago.ai上线向全球用户提供视频生成服务,把握了行业发展先机。

  而这背后,离不开“最懂大模型的AI基础设施”——商汤大装置的助力。商汤大装置以“灵活、稳定、专业”三板斧,通过灵活的算力资源调度,连续4周千卡不间断训练和专业高效的专家服务,助力智象未来实现了20%的资源利用率提升,让每一份算力都发挥到极致。

  想法流×商汤大装置:超100分的现象级应用是如何造就的?

  想法流创立于2023年,是一家专注于打造多模态AI驱动内容平台的初创企业。公司核心产品“造梦次元”定位于服务年轻用户,结合生成式AI技术,提供交互式、剧情化的虚拟角色互动体验。

  得益于商汤大装置从算力到模型的端到端支持,“造梦次元”通过算力和模型、模型和应用之间的紧密协同,既创造了最佳的用户体验,又获得了最大化的成本效益,如今已成为一款日均活跃互动时间超过100分钟的现象级应用。 

注:此文属于光明网登载的商业信息,文章内容不代表本网观点,仅供参考。
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • “三夏”沃野抢收忙

  • 擦亮“秘色瓷都”品牌 推动产业融合发展

独家策划

推荐阅读
记者从农业农村部获悉,截至5月28日17时,各地已收夏粮小麦4897万亩、当日机收面积超过1000万亩,今年全国“三夏”大规模小麦机收全面展开。
2026-05-29 09:11
垦利10-2油田位于渤海南部海域,探明原油地质储量超1亿吨,是渤海湾盆地凹陷带浅层发现的首个亿吨级岩性油田。中国海油天津公司工程技术作业中心相关负责人介绍:“垦利10-2油田钻完井作业面临井型多、层系多、开发方式多等‘三多’难点。
2026-05-29 09:09
早上8时许,四川省南充市高坪区走马镇姜家祠村村民姜萧将孩子送到村委会“农忙托管班”。为解决农忙季小孩看护缺位问题,姜家祠村因地制宜开设季节性公益“农忙托管班”,为村内适龄儿童提供免费集中托管服务。
2026-05-29 09:06
中国卫星导航定位协会近日发布《2026中国北斗时空产业发展白皮书》。所谓“北斗时空产业”,是以北斗卫星导航系统为核心,深度融合遥感地理信息、移动通信等多种技术手段的综合性产业体系。
2026-05-29 09:02
据中国载人航天工程办公室消息,神舟二十一号和神舟二十三号航天员乘组于28日进行交接仪式,两个乘组移交了中国空间站的钥匙。
2026-05-29 08:52
  人工智能(AI)正以前所未有的速度重塑着教育形态。放眼全球,AI与教育深度融合已不是“未来时”,而是汹涌澎湃的“现在进行时”。在这场由硅基智慧引发的教育革命面前,世界各国都在“大显身手”,基于各自特有的文化背景、教育传统与国家发展战略定位,在“AI+教育”的实施路径上展现出“百花齐放”之势。
2026-05-28 02:10
  当前,我国科普阅读需求呈现出高意愿、高黏性、高集中度的特点。调研显示,成人科普图书核心读者以36岁以上成熟群体为主,占比达82%,女性读者占62%,绝大多数为本科学历以上,企业技术人员、教育科研工作者、都市职场人构成消费主力。超过六成读者每周阅读三次以上,近三分之一年均阅读10本以上,阅读稳定性显著高于其他大众图书。
2026-05-28 02:10
站在河北沧州南皮县乌马营镇徐和杨村的航丰家庭农场地头,放眼望去,成方连片的小麦已泛起嫩黄,一派“小满未满,将熟未熟”的景象。
2026-05-28 02:00
中国社会科学院考古研究所(中国历史研究院考古研究所)27日发布最新成果。2025年9月至今,考古研究所已出版考古报告13部,专著、学术资料、科普读物13部,图录、论文集、数据集8部,中英文顶级、权威期刊上的简报、论文30余篇,并积极建设实验室集刊平台。
2026-05-28 02:00
27日0时16分,我国在文昌航天发射场使用长征七号改运载火箭,成功将通信技术试验卫星二十四号发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-05-28 01:40
在提交毕业论文终稿的最后时刻,辽宁省某高校教育学专业研二学生宋耘(化名)还是选择了求助某“专门降论文AIGC(人工智能生成内容)率”的商家。
2026-05-28 01:40
中国卫星导航定位协会近日发布的《2026中国北斗时空产业发展白皮书》显示,2025年,北斗时空产业总产值达到13323亿元。北斗核心产品持续迭代升级,芯片、模组等基础产品小型化、低功耗、高精度水平不断提升,国内主流手机北斗定位精度持续优化,为产业规模化应用奠定了坚实的技术基础。
2026-05-27 09:36
5月27日0时16分,我国在文昌航天发射场使用长征七号改运载火箭,成功将通信技术试验卫星二十四号发射升空,卫星顺利进入预定轨道,发射任务取得圆满成功。
2026-05-27 09:26
“十五五”规划纲要提出,投资于物和投资于人紧密结合。
2026-05-27 03:00
大屏幕上的数字快速跳动。十几轮激烈竞逐后,最终定格在212.4万元,成交!这是日前记者在湖北碳排放权交易中心电子竞价大厅看到的一幕。
2026-05-27 03:10
检测AI率,目的是维护学术研究的严肃性公平性,督促学生遵守学术规范、产出原创成果。然而,在现实操作中,一系列困扰学生乃至老师、学校的问题接连显露。
2026-05-27 02:50
位于北京大兴区的长子营湿地公园,草木葱茏,水面澄澈,鸟鸣声清脆悦耳,勾勒出一幅生机盎然的生态画卷。
2026-05-26 09:24
我国虽然核电铀燃料对外依存度高,但钍资源储量丰富,目前探明钍储量位居世界第二。以钍作核燃料不仅符合我国资源禀赋,甚至可能改变未来全球能源格局。
2026-05-26 09:18
我国已累计发布1750项食品安全标准,涉及2万多个指标,覆盖340多种食品类别,持续完善科学严谨、好用管用的食品安全标准体系。
2026-05-26 09:11
入汛以来,全国平均降水量达110.1毫米,较常年同期偏多18.6%。从空间分布来看,我国南北方均出现降水量较常年同期明显偏多区域。
2026-05-26 09:11
加载更多