网界
网络资讯 网界财经 科技人物 数据洞察 行业动态 智能出行 智能手机 数码极客 商业资讯

智元机器人GO-1大模型:开启通用具身智能新篇章

2025-03-10来源:ITBEAR编辑:瑞雪

近日,由知名技术博主“稚晖君”发起的创业项目智元机器人,正式揭晓了其首个通用具身基座模型——智元启元大模型(简称GO-1)。这款模型创新性地引入了Vision-Language-Latent-Action(ViLLA)架构,标志着具身智能领域的一次重要突破。

ViLLA架构的核心在于将VLM(多模态大模型)与MoE(混合专家)相结合。VLM部分借助广泛的互联网图文数据,实现了对通用场景的深刻感知和语言理解。而MoE则包含Latent Planner(隐式规划器)和Action Expert(动作专家)两部分,前者通过大量跨本体和人类操作视频数据,获得了强大的动作规划能力;后者则依托百万真机数据,具备了精细的动作执行能力。

智元机器人在五种不同复杂度的任务上对GO-1进行了测试,结果显示,相比现有的最优模型,GO-1的平均成功率提高了32%,从46%跃升至78%。特别是在“倒水”、“清理桌面”和“补充饮料”等任务中,GO-1的表现尤为出色。单独验证Latent Planner的作用时发现,增加Latent Planner可使成功率提升12%,从66%提高至78%。

GO-1大模型不仅具备强大的学习和泛化能力,还能从人类和多种机器人数据中汲取知识,快速适应新任务和学习新技能。它支持部署到不同的机器人本体上,实现真正的“一脑多形”。这意味着GO-1可以在不同形态的机器人之间迁移,快速适配,实现群体智能的提升。

更令人称道的是,GO-1大模型还具备持续进化的能力。借助智元提供的数据回流系统,GO-1可以从实际执行中遇到的问题数据中不断学习和进化,越用越聪明。这一特性极大地降低了具身模型的使用门槛,使得后训练成本大幅降低。

智元机器人在发布会上还预告了下一代具身智能机器人产品,但并未透露具体的推出时间。这一消息无疑为行业内外带来了更多的期待和想象空间。

GO-1大模型的成功发布,标志着智元机器人在具身智能领域取得了重要的阶段性成果。未来,随着技术的不断演进和应用的不断拓展,GO-1有望在更多领域发挥重要作用,为人类社会带来更加智能、便捷的服务。

阿里通义App焕新升级更名千问 5.0.0版本携三大核心能力强势登场
今日,阿里旗下通义App今日发布更新,名称正式变更为千问App,版本号为5.0.0。 在版本 5.0.0中,千问强调其核心能力包括:“对话问答”“智能写作”“全能相机”三大模块。 据知情人士透露,阿里巴巴计…

2025-11-15

谷歌前工程师再创业!AI数据分析新锐WisdomAI获英伟达等3.55亿融资
WisdomAI面向企业客户推出了AI驱动的对话式商业智能(BI)平台,提供AI数据分析业务,用户只需用自然语言提问便可获取分析后的答案。 WisdomAI称:“过去的BI只提供被动的、静态的仪表板,而Ag…

2025-11-15

百度世界大会发布AI新成果:文心5.0、昆仑芯升级,萝卜快跑领跑全球
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

百度世界大会亮点频出:文心5.0等成果发布,AI重构业务引领生产力革新
李彦宏在大会上表示,“我们用AI重构搜索结果页,不是简单地在搜索结果中插入AI摘要,而是把搜索从一个以文字内容和链接为主的互联网应用,转化为一个以图片视频等富媒体内容为主的AI应用。” 在李彦宏看来,AI数字…

2025-11-14

乌镇峰会:前沿科技碰撞,共绘网络空间命运共同体数智新蓝图
“非洲互联网之父”、加纳科网董事长尼·奎诺表示,像乌镇峰会这样的平台为发展中国家提供了宝贵的发声机会和参与空间;世界知识产权组织总干事邓鸿森表示,乌镇峰会为我们提供全球对话与合作的契机,这种对话与合作不仅是…

2025-11-13