点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:“科技春晚”放大招,这届机器人有自己的“GPT”了
首页> 科技频道> 创新创业 > 正文

“科技春晚”放大招,这届机器人有自己的“GPT”了

来源:光明网2025-01-13 16:24

  如果2024年是“AI元年”,那么2025年,AI技术将迎来怎样的变化?

  一年一度的“科技春晚”每年1月如期而至。作为全球最大、影响最广的消费类电子技术年展,今年的国际消费类电子产品展览会(简称CES)上“爆款”频出,其中英伟达发布的“NVIDIA Cosmos”作为首个世界基础模型更是格外吸睛。创始人黄仁勋表示,AI的下一个前沿就是物理AI(Physical AI)。“如果说ChatGPT定义了生成式AI,那么Cosmos将是机器人领域的‘ChatGPT时代’。”

“科技春晚”放大招,这届机器人有自己的“GPT”了

  世界基础模型将对哪些领域产生重要影响?对企业而言,如何运用AI技术真正创造商业价值?

  本期“视界”,小管邀请到复旦管院信息管理与商业智能系助理教授李文文分享对大模型升级、机器人技术革新及其商业应用的行业观察与思考。

“科技春晚”放大招,这届机器人有自己的“GPT”了

  李文文信息管理与商业智能系助理教授

  研究方向:商务智能,机器学习,医疗健康管理,平台管理

  01创造一个虚拟世界,让AI更了解“真实”

  “世界基础模型”利用生成式AI技术,模拟现实环境并基于文本、图像或视频输入预测准确结果。与利用大量文本数据进行训练的大语言模型不同,世界模型利用包括文本、图像和视频在内的输入数据来生成视频。通过从感官数据中学习表示和预测运动、力和空间关系等动态特性,它们能够理解物理世界中事物的性质、运行规律和空间特性。

  世界基础模型的作用并不是生成创意内容,而是帮助AI理解物理世界。例如,它能帮助AI理解物体如苹果受重力影响会掉落等基本物理规律,这种能力对于机器在物理世界中的交互非常重要。这项技术面向大众开放以后,每个开发者都可能有机会开发为下游应用或特定领域构建世界模型,例如工厂车间、仓库或高速公路,进而训练具有特定能力的机器人。

“科技春晚”放大招,这届机器人有自己的“GPT”了

  从英伟达目前已公开的信息来看,Cosmos模型基于在200万小时视频上完成训练,集成了生成式模型、tokenizer和视频处理管线,可以接受文本、图像或视频提示,生成高质量的虚拟世界状态,从而为自动驾驶和机器人应用提供定制化的视频输出。

“科技春晚”放大招,这届机器人有自己的“GPT”了

  在为训练机器人而生成的虚拟世界里,能够看到Comos模型可以生成工厂、仓库等环境,从而协助开发、训练机器人。例如,现实中,如果要使用真实的大型仓储环境为仓储机器人提供货物搬运、拣选、分拣等训练,需要花费大量成本,而通过Cosmos,就可以创建模拟的物理仓储环境,从而训练、观察、优化机器人的各种动作。

  02让自动驾驶真正“像人一样”开车

  实际上,世界模型的概念很早就已经提出。图灵奖得主杨立昆就认为,未来的人工智能发展方向, 应该是通过无监督的方式观察世界、与世界交互,然后进行学习,这条技术路线是GPT这样的大语言模型所不能实现的,我们需要训练的是世界模型。

  例如,原先让AI学会开车,需要投喂大量的开车视频让AI学习,类似于“题库刷题”,但人类在驾车时会遇到很多没有学过的状况,例如雪天路滑、前车追尾、人会下意识做出避让反应,无监督式的学习就是要让AI像现实里的人类一样,在世界模型里观察世界,然后行动,在这个过程中学会应对未知的状况。

  关于如何达到L4等级的高度自动驾驶技术,自动驾驶领域一直有着技术路线之争,世界模型的出现带来了新的方向。目前较为成熟的技术方案是使用激光雷达以及其他传感器来让汽车感知周围事物,成本比较高。

“科技春晚”放大招,这届机器人有自己的“GPT”了

  特斯拉最新提出的理念是采用“端到端”技术,基于摄像头所看到的环境进行实时判断,从而决定车辆行驶的路线、进行一系列驾驶操作等。小马智行则认为,首先需要一个世界模型去构造一个虚拟环境,包含各种道路情况,行人以及其他车辆的行为。然后让自动驾驶模型在这个环境中进行训练,就像人类一样去观察路况,通过强化学习去不断进化迭代,并应对可能发生的各种状况。Cosmo正好能够为这类技术路线提供世界基础模型的支持。

  但是现在Comos开放的测试环境有限,目前平台能够生成的虚拟世界还存在不少漏洞。例如,生成的自动驾驶测试环境里,路人的形象很模糊,前方会突然出现违背正常规律的车辆等,平台还有待进一步升级优化。

  03没有技术嗅觉,玩不转AI时代

  如果从商业应用角度来看AI技术,我们需要思考当前的大模型技术仅仅是昙花一现,还是可以在商业层面发挥实际作用,这也是许多企业面临的关键问题。

  在ChatGPT面世之前,大众对于人工智能的理解较为有限,通常局限于执行一些基础的智能化任务。然而,当GPT等产品推出之后,极大地激发了大众的想象力与需求。Sora的文生视频技术更是模糊了现实与虚拟的界限,开始将物理世界置于模拟器之中。

  但这些技术目前在商业上还没有取得显著成功,甚至Open AI本身也没有实现盈利。所以,无论是科技创新型公司还是大型企业,对他们的领导者而言,未来他们必须拥有一项综合技术与商业思维的新技能,我将其命名为“技术嗅觉”。

“科技春晚”放大招,这届机器人有自己的“GPT”了

  “技术嗅觉”是一个全新的概念,也是我认为在AI时代对管理者而言非常重要的概念。

  所谓技术嗅觉,就是将技术理解与市场洞察相结合的一种能力。这种能力不仅仅是指技术人员的专业技能,也不只是纯商业活动的一部分,它要求对技术的发展有一定理解,即便不是技术或科研人员,也需要知道技术能够解决什么问题。与此同时,还需要对市场需求有敏锐的洞察,了解用户真正需要的是什么,以及市场的发展趋势如何。最终,技术嗅觉可以帮助识别商业化机会。

  一个常见的决策场景是在技术发展的不同阶段,企业需要考虑切入的时机。例如,新技术刚刚出现时,企业是否应该立刻引入,还是等到技术成熟后再采纳,这需要权衡。企业应该根据自身定位,选择不同的切入时机和介入深度。

“科技春晚”放大招,这届机器人有自己的“GPT”了

  所有这些决策需要结合技术嗅觉,不仅依赖传统的商业嗅觉,这种综合能力是现代企业在动荡的技术环境中做出最佳决策的基础。从这点上说,在自动驾驶汽车、机器人技术发展日益蓬勃的当下,英伟达推出Cosmos模型也是一种技术嗅觉的体现。

  关于未来,有专家预测2025年将是“具身智能体元年”。“具身智能体”概念是人工智能落地化的重要一步,其核心不再仅仅是对话式的大型语言模型,而能够调用外部工具,如搜索引擎、知识图谱、思维导图工具等,进而执行更复杂的任务。

  这一变革将使得大型语言模型不再局限于生成自然语言,而是在行动上,尤其是在机器人领域实现更广泛的应用与实践。世界基础模型的出现和后续迭代升级,将对具身智能发展产生怎样的影响,非常值得期待。

  (来源:复旦管院 文字:傅文婧 编辑:王菲妮 图片:李文文老师、NVIDIA官网、部分由AI生成)

[ 责编:战钊 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 2026年巴塞尔艺术展香港展会启幕

  • 江西上饶:防火宣传进景区

独家策划

推荐阅读
全国科学技术名词审定委员会25日发布《关于发布试用人工智能领域名词token中文名“词元”的公告》,决定在综合考量社会各界意见建议的基础上,优先推荐“词元”作为人工智能领域名词token的中文名,并面向全社会发布试用。
2026-03-26 09:23
木卫二是一颗冰封的木星卫星,也是太阳系内最有希望孕育地外生命的地方。“欧罗巴快船”团队认为,他们将发现适宜生命生存的海洋,但除非探测器真正抵达、展开探测,没有人能给出确切的答案。
2026-03-26 09:24
作者:陆俊杰(南通大学副校长,江苏省习近平新时代中国特色社会主义思想研究中心特约研究员)  在促进创新链产业链资金链人才链深度融合、推动科技成果高效转化应用上探索新途径,是“十五五”时期江苏经济社会发展的重要目标任务。深耕“双高协同”不仅是破解科研创新与产业需求脱节的关键举措,更是落实创新驱动发展战略的重要布局。
2026-03-26 09:24
记者从中国发明协会获悉:在瑞士日内瓦举行的第五十一届日内瓦国际发明展上,中国代表团共获得90项金奖、95项银奖和52项铜奖。
2026-03-26 09:30
工业和信息化部25日公布,今年前2个月,我国通信业运行平稳,电信业务总量保持增长,5G、千兆光网、物联网等网络基础设施建设有序推进。截至2月末,5G基站总数达490.9万个,比上年末净增7万个,占移动基站总数的38%。
2026-03-26 09:24
3月25日,国家自然科学基金委员会在2026中关村论坛年会开幕式上发布2025年度“中国科学十大进展”,10项重大基础研究突破入选。界面调控新方法创制面向空天应用的高性能柔性叠层太阳能电池示意图 国家自然科学基金委员会供图 
2026-03-26 09:22
3月25日,以“创新与发展”为永久主题,由科技部、国家发展改革委、工业和信息化部、国务院国资委、中国科学院、中国工程院、中国科协和北京市政府共同主办的2026中关村论坛年会在北京拉开帷幕。
2026-03-26 09:21
记者24日从农业农村部获悉,农业农村部近日印发通知,督促指导各地依法严厉打击坑农害农、危害粮食安全和农产品质量安全违法行为,守护群众“舌尖上的安全”,持续夯实国家粮食安全根基。
2026-03-25 10:22
氢能兼具能源、资源、储能介质三重属性,氢能产业科技含量高、低碳属性强、发展空间大。通知提出到2030年,通过应用规模扩大,推动氢能应用技术、工艺、装备创新突破,实现燃料电池、电解槽、储运装置和材料等迭代升级,推动氢能成为新的经济增长点,支撑实现经济社会发展全面绿色转型。
2026-03-25 10:21
林间密密麻麻的印痕,正是东北虎豹国家公园生态环境越来越好的体现。在科技守护与不懈坚守下,东北虎豹国家公园的生态成果愈发显著:东北虎和东北豹的数量由公园试点初的27只和42只,增长至当前的70只和80只左右。
2026-03-25 10:11
国家卫生健康委和中国气象局24日联合发布首期全国花粉浓度预报服务提示,为公众提供精准防护指引。目前正值春季,以木本植物花粉传播为主,建议过敏人群及时关注本地花粉浓度和种类变化,必要时明确过敏原,提前做好防护和出行安排。
2026-03-25 10:04
自然资源部日前发布四川省冕宁县牦牛坪矿区稀土矿资源储量核实勘查项目成果,矿区新增稀土资源量966.6万吨。据悉,牦牛坪矿区稀土矿资源储量核实勘查项目还新增伴生萤石资源量2713.5万吨、伴生重晶石资源量3722.8万吨,均达到超大型规模,具有重大战略意义。
2026-03-25 10:00
记者了解到,自20世纪60年代推广杂交玉米种以来,我国玉米的单产提高了约2.7倍,其中51%的增益都来自优良杂交种的选育与应用。进一步研究发现,在现代杂交育种过程中,玉米的基因有害变异被不断清除或互补,并且,杂交种中有害等位基因被抑制表达的比例与其产量和育成年代同步增长。
2026-03-24 09:29
2023年,国务院部署开展专利转化运用专项行动(以下简称“专项行动”)。教育部科学技术与信息化司司长周大旺表示,教育部着力畅通科技成果转化的链条,加速把高校丰富的专利转变为产业发展的红利。
2026-03-24 09:28
走进内蒙古博物院的有机质文物修复室,时间似乎放慢了脚步,空气中透着静谧,只有工具偶尔轻碰的细微声响。”  无机质文物修复室里,文物修复师季园园展示了另一种“手术”场景。
2026-03-24 09:28
柳申滨最初以针刺治疗皮肤炎症及穴位敏化机制为切入点,试图探寻针刺调控皮肤靶器官的效应规律。”  通过和临床医生交流,柳申滨了解到,在压力、焦虑等心理应激状态下,特应性皮炎患者的皮肤炎症会显著加重。
2026-03-24 09:28
全球最大人工智能(AI)模型API聚合平台OpenRouter最新数据显示,3月16日至3月22日,全球AI大模型总调用量为20.4万亿Token,环比增长20.7%。”
2026-03-24 09:28
杂交稻的大面积推广显著提升了水稻产量,但其生产长期依赖程序复杂、成本高昂且需年年重复的杂交制种过程。
2026-03-23 09:40
近日,澳大利亚一位机器学习领域科技企业家,通过人工智能大模型自行设计肿瘤疫苗,救治自家患癌宠物犬的故事广受关注。
2026-03-23 09:39
记者从中国石化获悉,我国首套全链条国产化溶液法聚烯烃弹性体工业化装置在天津进入试运行,相关生产技术取得原创性突破,将有效缓解我国光伏等战略性新兴产业对该材料的进口依赖。
2026-03-23 09:33
加载更多