网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

智元机器人EnerVerse架构:突破具身智能领域,引领动作规划新潮流

2025-01-08来源:ITBEAR编辑:瑞雪

在具身智能研究领域,如何使机器人在任务指导和实时环境感知的基础上规划未来行动,一直是科研人员面临的重大挑战。这一难题主要受到“模态对齐”和“数据稀缺性”两大因素的制约。近日,智元机器人团队提出了一种名为EnerVerse的创新架构,该架构通过自回归扩散模型,在生成未来具身空间的同时,也指导机器人执行复杂任务。

EnerVerse架构与现有的视频生成模型应用方法存在显著差异。它深入结合了具身任务的实际需求,创新性地引入了稀疏记忆机制(Sparse Memory)和自由锚定视角(Free Anchor View, FAV)。这一创新不仅显著提升了4D生成能力,还在动作规划性能上实现了重大突破。

据智元机器人团队介绍,实验结果显示,EnerVerse不仅具备生成未来空间的能力,还在机器人动作规划任务中达到了当前最优水平(SOTA)。这一成果标志着在具身智能领域取得了重要进展。目前,EnerVerse的项目主页和论文《EnerVerse:设想机器人操作的具身未来空间》已经上线,模型及相关数据集也即将面向公众开源。

EnerVerse的主要科研成员来自智元机器人研究院的具身算法团队。论文的共同第一作者黄思渊,是上海交通大学与上海人工智能实验室的联合培养博士生,师从香港中文大学多媒体实验室(CUHK-MMLab)的李鸿升教授。黄思渊博士期间的研究方向主要集中在基于多模态大模型的具身智能和高效智能体的研究,并在CoRL、MM、IROS、ECCV等国际顶级会议上以第一作者或共同第一作者身份发表了多篇论文。

另一位共同第一作者陈立梁,则是智元机器人的具身算法专家,主要负责具身空间智能和世界模型的研究。EnerVerse架构的成功研发,不仅展示了智元机器人团队在具身智能领域的深厚积累,也为未来机器人技术的发展提供了新的思路和方向。

百度AI成果井喷:从智能涌现到效果涌现,产业结构迈向健康倒金字塔
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-15

百度世界大会:李彦宏携AI“军火库”全面开放,开启应用新篇章
现场演示连线数字人罗永浩环节上,出现了“翻车”这一尴尬现象时,李彦宏的情绪也并没有太多波动,而是感觉“有点遗憾”,并表示“其实我们在之前演练的过程当中觉得这个效果还是非常令人惊艳的”。 还有大模型层面上的文…

2025-11-15

百度世界大会发布AI新成果:文心5.0等亮相,李彦宏畅谈AI内化生产力变革
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-13

百度“文心杯”第三届落幕:8支团队获千万投资,李彦宏力推AI应用普及
李彦宏表示,我们看到越来越多的创业者在各种场景发现AI的新能力、新效果,希望更多的人能够加入这个发现之旅,也正基于此,百度连续三年举办“文心杯”创业大赛。 第三届“文心杯”创业大赛8支优胜团队共获得数千万元…

2025-11-13

2025百度世界大会聚焦AI发展:成果发布,内化能力引领新质生产力变革
本届大会以“效果涌现”为主题,聚焦国产芯片最新进展、大模型升级、AI应用创新与全球出海,呈现了百度作为中国人工智能领军企业,如何将AI技术内化为产业发展的原生动能,为加快形成新质生产力提供可落地的“百度方案”…

2025-11-13