点击右上角微信好友

朋友圈

请使用浏览器分享功能进行分享

正在阅读:星动纪元端到端原生机器人大模型ERA-42亮相
首页> 科技频道> 人工智能 > 正文

星动纪元端到端原生机器人大模型ERA-42亮相

来源:光明网2024-12-23 17:06

  近期,星动纪元端到端原生机器人大模型ERA-42正式亮相,即“纪元原生机器人大模型”,展示了其与自研五指灵巧手星动XHAND1结合后的灵巧操作能力,已学会了使用不同工具完成100多种复杂灵巧的操作任务,并且持续在同一个模型下学习新的技能。例如,拿起桌上螺钉钻钻紧螺钉、用锤子敲打钉子、将水杯扶正后再往水杯中倒水等任务。

星动纪元端到端原生机器人大模型ERA-42亮相

  基于ERA-42,星动XHAND1能用不同工具完成多种灵巧操作新任务

  这是业界首次仅通过同一个具身大模型就实现了五指灵巧手像人手一样使用多种工具完成上百种灵巧复杂操作任务,展现了ERA-42行业领先的通用、灵巧操作能力。模型不需要任何预编程技能,完全基于其强大的泛化和自适应力,能在不到2小时内通过收集少量数据就学会执行新的任务。同时,ERA-42还在快速不断学习更多新技能中。

星动纪元端到端原生机器人大模型ERA-42亮相

  基于ERA-42,星动XHAND1可完成100多种精细化、智能化的五指灵巧手操作任务

  ERA-42也是世界范围内首个真正的五指灵巧手具身大模型,开启了具身大模型的通用灵巧操作时代。

  “真正”的具身大模型才是开启通用具身智能体的密钥,需要具备以下三个要素:

  一是统一一个模型泛化多种任务和环境:通过构建一个统一的原生模型,融合视觉、语言、触觉和身体姿态等全模态信息,实现对不同任务和环境的泛化能力。

  二是端到端:从接收全模态数据,到生成最终输出(如决策、动作等),通过一个简洁的神经网络链路完成。该过程无需人为设计特征、预编程或干预处理步骤,使得具身智能体能够实时适应不同任务和环境,显著提升灵活性与开发效率。

  三是Scaling up(规模化):真正的统一的端到端算法才允许模型通过持续的数据积累实现自我完善,使得具身大模型在数据量指数级增长的同时,不仅提升性能,还能在未知任务中展现卓越的自适应和泛化能力。

  例如,被行业广泛熟知的Physical Intelligence (简称PI)发布的π0模型就具备上述要素,是典型的真正意义上的端到端具身大模型。

  星动纪元ERA-42是国内首个真正意义上的端到端原生机器人大模型,比肩世界领先水平

  早期,星动纪元和PI几乎同期采用了端到端算法来提升其原生机器人大模型性能,PI推出的π0模型,通过结合互联网规模的视觉-语言预训练与机器人操作数据集后训练,使得机器人能够在人类环境中自主执行多种复杂任务,这是机器人从特定任务的“专家”向多任务的“通才”发展历程上的重要一步,也是具身大模型领域的一个里程碑。

星动纪元端到端原生机器人大模型ERA-42亮相

  星动纪元早期发布的研究成果和Physical Intelligence (PI)几乎不谋而合

  星动论文HiRT: Enhancing Robotic Control with Hierarchical Robot Transformers发表在CoRL2024

  而后,星动纪元又探索了另一条训练道路,采用大规模视频数据学习策略,涵盖无标注的视频数据、公开各类形态机器人的数据、人类活动数据以及遥操作数据等。并且,在上述数据的使用上,星动纪元不是直接模仿视频里的人怎么去做,而是学习行动之后会产生什么样的结果。这种方式使得学习效果不受限于数据质量,能大大降低数据收集成本,解决了数据消耗量巨大、需要大量高质量数据的行业难题。

  此外,星动纪元的技术团队已将世界模型融入原生机器人大模型中,使得模型不仅具备行动能力,还具备了对物理世界的理解能力,能够对未来行动轨迹进行预测,还能迅速响应外部干扰,并在任务执行过程中持续自适应优化行为,直至任务完成。提升了机器人执行任务的高效性和准确性。

星动纪元端到端原生机器人大模型ERA-42亮相

  后期,星动纪元探索了融合世界模型的原生机器人大模型

  星动论文Prediction with Action: Visual Policy Learning via Joint Denoising Process发表在NeurIPS 2024

  星动纪元打造的端到端原生机器人大模型ERA-42凭借其预测能力,模型具备强大的泛化、自适应和规模化能力。结合星动纪元为AI打造的全新硬件平台,可快速实现具身智能体软硬件协同进化和商业化落地。

  星动纪元端到端原生机器人大模型ERA-42引领具身大模型进入通用灵巧操作时代

  1)相比夹爪,星动XHAND1已经可以完成100多种精细化、智能化的复杂灵巧操作任务

  相比夹爪,基于ERA-42能力,五指灵巧手能够真正像人手一样使用更多种多样的工具,完成更通用、灵巧性更强、复杂度更高的百种以上操作任务。

星动纪元端到端原生机器人大模型ERA-42亮相

  基于ERA-42,五指灵巧手星动XHAND1相比夹爪能使用更多不同工具执行更灵巧操作

  2)星动纪元原生机器人大模型ERA-42能理解物理世界和预测未来

  融合世界模型后,ERA-42具备对物理世界的理解以及对未来的预测的能力,从而大幅提升了泛化能力和任务成功率。

  例如,下图中上方的图片展示了真实物理世界中打开冰箱的逐帧操作,下方的图片则为ERA-42生成的环境建模与对打开冰箱任务的逐帧预测。可以看到两张图片非常接近,说明模型预测非常准确。这与其他机器人大模型直接学习行动、而忽视对世界本身理解的方式,或者仅将世界模型用于生成仿真数据的方式,存在本质的区别。

星动纪元端到端原生机器人大模型ERA-42亮相

  真实世界执行任务和ERA-42预测执行任务对比图

  3)星动纪元原生机器人大模型ERA-42具备更强泛化能力

  基于大规模视频数据的预训练,只需采集少部分数据,基于ERA-42的泛化能力,短时间内通过单一的策略灵巧手就能学会执行新的操作任务。此前,星动纪元技术团队就通过这种训练方式采集简单的红黄蓝方块抓取数据,成功实现了从未见过的多样化物体(如胡萝卜、茄子等)的抓取泛化,并相对其他模型算法在泛化任务上显著提升了成功率。

星动纪元端到端原生机器人大模型ERA-42亮相

  通过简单彩色方块的抓取数据实现多样化物体的泛化抓取操作

  4)星动纪元原生机器人大模型ERA-42具备更强自适应性

  由于融合了世界模型,ERA-42不管在单任务上,还是长序列任务上都展现出了业内领先的强大抗干扰能力。

  5)星动纪元原生机器人大模型ERA-42初步体现“Scaling效应”

  并且研究结果表明,随着模型规模的扩大,任务成功率也明显提升,初步体现了和大语言模型训练中类似的“Scaling效应”,即模型规模与性能之间的正相关性。

星动纪元端到端原生机器人大模型ERA-42亮相

  “Scaling效应”显示模型与机器人性能呈现正相关性

  星动纪元端到端原生机器人大模型ERA-42和为AI打造的全新硬件平台协同进化,共建原生具身智能体

  构建通用具身智能体需要软硬件协同迭代,就像人类的脑和身体是从小到大同步协同成长的一样。

  因此,星动纪元打造了为AI定义的全新硬件平台。以星动自研推出的五指灵巧手星动XHAND1为例,共有12个主动自由度,并采用纯电驱方式,且每个自由度都有对应的驱动源,实现全自主五指关节驱动,能执行高精度任务。星动XHAND1每个手指配备一个高分辨率(>100点)触觉阵列传感器,提供精确的三维力触觉和温度信息。单手最大握力能达80N,负载可达25kg。

  星动XHAND1在作业能力上展现出的高性能在协同ERA-42后,为实现复杂灵巧操作任务奠定了基础。

  依托ERA-42,星动纪元通用人形机器人执行任务的通用性和泛化性将大幅提升,结合此前发布的在复杂多样的地形上稳定行走和奔跑的运动性能,配合上下肢协同作业能力,潜在应用场景也将更加多元化,真正实现原生的通用具身智能体的产业化落地。(柯岩)

阅读剩余全文(

相关阅读

您此时的心情

光明云投
新闻表情排行 /
  • 开心
     
    0
  • 难过
     
    0
  • 点赞
     
    0
  • 飘过
     
    0

视觉焦点

  • 逐梦海天 青春滚烫——记海军山东舰起降保障中队

  • 创新潮涌链博会

独家策划

推荐阅读
从意大利实验室到西北农学院,从抗战时期到和平年代,周尧用70年时光让中国昆虫学从5%的定名权走向自主。
2025-07-18 09:06
记者从会上获悉,截至今年6月,我国每万人口高价值发明专利拥有量已达到15.3件,提前实现“十四五”规划预期的12件目标。
2025-07-18 09:04
而在此次观测中,天文学家发现,在HOPS-315及其周围的原始星盘中,不仅存在固态的结晶矿物,还存在气态的一氧化硅。
2025-07-18 09:04
旨在充分发挥计量支撑产业新质生产力发展的基础保障作用,推动“溯源链、创新链、产业链”融合发展,使计量成为促进产业新质生产力发展的催化器和引擎。
2025-07-18 09:04
该所作物耐逆性调控与改良创新团队日前联合国内外研究机构,构建了首个水稻的多器官单细胞多组学图谱,
2025-07-18 04:30
太阳是地球气候系统的主要能量来源,其活动通过总辐射、紫外辐射、高能粒子沉降等多种形式影响地球大气。近年来,我国夏季降水雨带呈现出持续北移的趋势。
2025-07-18 04:30
人机语言交互的“温度”,其核心在于能否实现情感共鸣、文化适配与价值传递。语言不仅是信息符号,更是心灵沟通的桥梁。为冰冷的代码注入人文温度,需在技术突破与设计理念上双轨并进。
2025-07-17 04:30
近日,中国科学院海洋研究所万世明团队,基于海洋沉积物中的黑碳记录,重建了过去30万年以来东亚北部的古火演化历史,结合欧洲、东亚、东南亚及澳大利亚区域的记录以及考古遗址大数据,发现现代人类大规模用火始于约5万年前。
2025-07-17 04:30
在飞行器大家庭中,有一类特别的成员——翼伞。它们没有刚硬的机翼,却凭着一片巨大柔软的“翅膀”,借助风力优雅地翱翔于天际;它们结构看似简单,却蕴含着空气动力学的精妙智慧。翼伞是融合古老降落伞原理与现代智能科技的独特柔性无人飞行器,包含翼、控制系统、负载,如果加上推力系统,就可化身为伞翼无人机。
2025-07-17 04:30
近年来,移动电源行业呈现出较为迅速的发展趋势。与此同时,移动电源安全事故频发,严重威胁消费者生命财产安全。通过制定强制性国家标准,
2025-07-17 03:55
由该院枸杞科学研究所联合中国林业科学院林业研究所编制的《枸杞属植物新品种特异性、一致性、稳定性测试指南》获得国际植物新品种保护联盟通过。
2025-07-17 04:00
武汉华大生命科学研究院联合南方科技大学等单位,在单细胞水平上成功解密了拟南芥叶片衰老的过程。
2025-07-16 10:44
不只是产量最大,“深海一号”大气田还是我国迄今为止自主开发建设的作业水深最深、地层温压最高、勘探开发难度最大的深水气田。
2025-07-16 10:42
我国正研制《卓越工程师培养认证标准》,该标准是保障卓越工程师培养从“样板间”走向宏大队伍的基础。
2025-07-16 10:39
七月下半月和八月上半月是我国主汛期的最重要阶段,应急管理部指导各地加强灾害风险隐患信息报送队伍建设,开展广泛培训,目前总人数已达115万人。
2025-07-16 10:25
为强化未成年人网络保护,营造良好网络环境,近日,中央网信办印发通知,在全国范围内部署开展为期2个月的“清朗·2025年暑期未成年人网络环境整治”专项行动。
2025-07-16 10:23
新时代新征程,以中国式现代化全面推进强国建设、民族复兴伟业,实现新型工业化是关键任务。
2025-07-15 04:10
现阶段,人工智能赋能新型工业化已取得明显成效,但仍存在人工智能关键硬件与开源软件储备不足、人工智能在重点行业领域应用率偏低、人工智能领域人才短缺且结构不合理、缺乏适应人工智能发展的标准体系和法律法规等问题。
2025-07-15 04:10
2025年可谓人形机器人的“破圈”之年。从蛇年春晚舞台的机器人扭秧歌,到北京亦庄的机器人马拉松,再到浙江杭州的机器人格斗赛……人形机器人正从“实验室”迈向各类“应用场”。
2025-07-15 02:55
科考船在狂风巨浪中剧烈摇摆,寻找渺小的目标如同大海捞针。回收沉睡海底半年的海底地震仪,是这次出海科研任务中最艰难的一环。“快看!在那儿!”随着一声疾呼划破沉寂,
2025-07-15 02:55
加载更多