点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:清华×斯坦福团队Ctrl-World世界模型登顶具身智能榜单
首页> 科技频道> 综合新闻 > 正文

清华×斯坦福团队Ctrl-World世界模型登顶具身智能榜单

来源:光明网2026-02-26 17:40

  光明网讯 春晚上,中国机器人的精彩表现让人印象深刻,今日,来自清华和斯坦福的联合研发团队,又在具身智能核心技术层面交出了一份亮眼答卷。

清华×斯坦福团队Ctrl-World世界模型登顶具身智能榜单

  2月26日发布的全球具身智能领域的权威评测World Arena榜单上,由清华大学陈建宇(星动纪元创始人)团队与斯坦福大学 Chelsea Finn(Physical Intelligence联合创始人)团队联合研发的 Ctrl-World 世界模型,在具身任务能力上斩获全球第一,击败了包括谷歌Veo 3.1、英伟达Cosmos-Predict 2.5在内的世界顶尖模型。同时,其视频生成能力也排名全球第二,仅次于阿里团队的Wan 2.6,超越了谷歌和英伟达的产品。

  要理解Ctrl-World的突破,首先需要了解什么是“世界模型”。通俗地说,世界模型是一个为机器人打造的“高级虚拟训练场”,它不仅能生成逼真的视频画面,更重要的是,它内置了重力、摩擦力、空间逻辑等物理规则。研究者可以让机器人在这个虚拟世界里进行无数次“模拟考试”,学会各种技能,再把学到的本领应用到现实世界中,从而大幅降低真实测试的成本与风险。

  榜单显示,Ctrl-World在主体一致性、轨迹精度、深度准确性、策略评估一致性四大核心维度上全部登顶。

  在主体一致性上,它以0.8411的得分位居全球第一,这意味着模型生成的物体在视频中能保持形状、颜色稳定,不漂移不变形,为机器人提供了高保真的“数字孪生”交互对象。

  在轨迹精度上,它以0.4766的得分同样排名榜首,生成的机械臂运动轨迹与真实物理轨迹几乎完全吻合,动作精准连贯。

  在深度准确性上,它以0.9300的得分跻身全球第一梯队,模型对三维空间结构把握精准,能避免机器人在抓取、堆叠等操作中因“空间感知偏差”导致的抓空、碰撞问题。

  在策略评估一致性指标方面,Ctrl-World以高达0.986的Pearson相关系数(满分1分)登顶全球第一,相比之下,英伟达Cosmos-Predict 2.5的相关性仅为0.483。这意味着Ctrl-World的虚拟测试结果更值得信赖,开发者可以用虚拟测试替代部分真实环境测试,从而大幅降低在真实世界中反复测试的高昂成本。

清华×斯坦福团队Ctrl-World世界模型登顶具身智能榜单

Ctrl-World的策略评估一致性结果

  此次Ctrl-World登顶的WorldArena榜单,由清华大学牵头,联合普林斯顿大学、新加坡国立大学、北京大学等8所全球顶尖学术机构共同研发,围绕“真能干活”设计评测体系,涵盖16大核心指标和3大真实应用任务。评测中,70位专业标注者对3500个视频进行主观校验,确保结果贴近人类对“实用”的直觉判断。(记者 李欣哲)

[ 责编:田新宇 ]
阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 一册繁花 满目春色

  • 新疆多地降温降雪

独家策划

推荐阅读
“十五五”时期,香港要主动参与国家战略布局,将自身的国际化优势、专业服务优势与国家的发展需求精准对接,为实现更高水平的开放合作贡献香港力量。在科研方面,香港科研基础扎实,有实力承担国家重大科研任务;香港科学家对参与国家科技计划、推动国家科技创新怀有很高的热情和积极性。
2026-03-12 10:30
心脑血管疾病已成为威胁我国人民生命健康的“头号杀手”。与此同时,心脑血管疾病发病及致残、致死呈现出明显的年轻化趋势,疾病负担持续加重,对我国推进健康中国建设、实现全民健康目标构成了挑战。
2026-03-12 10:30
对此,应该充分发掘当地的生态价值和文化价值,探索因地制宜的保护路径,保留浓郁“农味”与“地方味”,让古老农耕智慧、生态智慧在当代生活中延续生机、展现活力。这样不仅有助于实现农文旅融合发展,还能给我们的子孙后代保留良好的生态环境和生态景观,接续传承好丰厚灿烂的生态文化。
2026-03-12 10:30
今年政府工作报告提出,深化拓展“人工智能+”,促进新一代智能终端和智能体加快推广,推动重点行业领域人工智能商业化规模化应用,培育智能原生新业态新模式。张壮代表说,在竞逐人工智能创新的赛道上,柳州加速布局。
2026-03-12 10:30
记者詹媛11日从中国科技馆了解到,我国的科普大篷车项目自2000年启动实施以来,以“科普轻骑兵”的方式活跃在祖国大江南北,将前沿科技动态、趣味互动展品、优质科教资源送到基层公众身边。
2026-03-12 10:30
“龙虾”智能体通过整合调用通信软件和大语言模型,在用户本地电脑自主执行文件管理、邮件收发、数据处理等复杂任务。”魏亮说,有关方面也会持续做好安全监测,如发现相关安全风险将及时预警,为用户安全使用提供必要的技术支持。
2026-03-11 09:36
作为人类的“第二大脑”,AI for Science正在全球范围内引发科研范式的深刻变革,也成为全国两会期间代表委员关注的话题。3月7日,在全国政协十四届四次会议第二次全体会议上,全国政协委员、中国科学院院士周志华发言建议,以人工智能引领科研范式变革。
2026-03-11 09:36
全国政协委员、中国科学院院士、南京大学副校长周志华在接受光明网记者采访。
2026-03-11 07:00
以医工交叉+成果转化为抓手,凭借硬核科创成果精准攻坚,同时高标准建设国家药监局监管科学创新基地,为产业发展提供标准与工具支撑。
2026-03-11 09:33
作者:余有成 张立华 吴 飞(分别系中国人工智能学会副秘书长;复旦大学智能机器人研究院常务副院长、特聘教授;我国的独特优势,在于探索出一条“软件定义算力、算法驱动效能、人工智能+赋能场景”的创新路径。
2026-03-11 09:32
具体而言,在种植与流通环节,中药农业面临良种普及率不高、生产种植分散、标准化程度偏低等现实问题。可制定国家统筹的野生资源抚育与替代技术攻关清单,利用大数据监测价格与供给波动,增强产业链供应链韧性。
2026-03-11 09:31
光明日报北京3月10日电 记者张晓华从中国航天科技集团获悉,目前中国探月工程四期正稳步推进,2026年将研制发射嫦娥七号探测器,首次奔赴月球南极,寻找水冰存在的证据。中国航天科技集团五院研究员孙泽洲表示,在行星探测方面,未来我国还将发射天问三号和天问四号。
2026-03-11 09:30
当前全球人工智能竞争日趋白热化,大模型手机助手成为智能终端领域的核心竞逐赛道。建议以技术协同创新为核心、以产学研深度融合为支撑、以包容审慎监管为保障,筑牢自身核心优势,抢抓大模型手机助手产业窗口期。
2026-03-10 09:57
近日,由蓝箭航天研制的220吨级液氧甲烷全流量补燃循环发动机“蓝焱”完成整机全系统长程试车,标志着我国在大推力高性能液体火箭发动机领域持续取得突破性进展。
2026-03-10 09:30
从空天地一体化网络到通信、感知与人工智能深度融合,6G被视为重塑全球数字信息基础设施格局的重要技术底座。
2026-03-10 09:29
我国目前农业科技进步贡献率已经超过64%,农作物良种覆盖率超过96%,农作物耕种收综合机械化率达到76.7%,“农业现代化建设迈上了一个新台阶”。
2026-03-10 09:27
全国两会期间,“养龙虾”的话题登上热搜。全国人大代表、中国工程院院士高文说:“现在大家急得不得了,生怕没有养上‘龙虾’。”
2026-03-10 09:26
从实验室的“青苹果”到产业端的“金苹果”,距离有多远?2026年全国两会期间,两位代表分享了他们的探索实践。
2026-03-09 09:46
加快科技自立自强,既是破解产业升级瓶颈的重要支撑,也是抢占未来产业新赛道、培育新质生产力的关键依托。
2026-03-09 09:45
在全国两会会场,记者见到了贵州省六盘水市水城区农业农村局农业综合开发中心主任杨恩兰代表,聊起了她来京前的“田间故事”。
2026-03-09 09:44
加载更多