刚刚,Figure机器人迎来大升级,像人类一样推理,「拿捏」任意家庭用品

来源:学术头条
-
完整的上半身控制:Helix 是首个能够对整个人形上半身(包括手腕、躯干、头部和单个手指)输出高速率连续控制的 VLA。 -
多机器人协作:Helix 是首个可在两个机器人上同时运行的 VLA,使它们能够解决共享的长程操作任务,操作它们从未见过的物品。 -
可直接商用:Helix 是首个在完全板载嵌入式低功耗 GPU 上运行的 VLA,可立即投入商业部署。


-
系统 2:经过互联网训练的板载 VLM,工作频率为 7-9 Hz,用于场景理解和语言理解,可广泛应用于各种物体和环境。 -
系统 1:快速反应视觉运动策略,将系统 2 生成的潜在语义表征转化为 200 Hz 的精确连续机器人动作。
-
速度和通用性:Helix 的速度可与专门的单任务行为克隆策略相媲美,同时还能对数千个新测试对象进行零样本泛化。 -
可扩展性:Helix 可直接输出高维动作空间的连续控制,避免了先前 VLA 方法中使用的复杂动作 token 化方案,这些方案在低维控制设置中取得了一定成功,但在高维仿人控制中面临扩展挑战。 -
结构简单:Helix 使用标准架构——系统 2 使用开源、开放权重的 VLM,系统 1 使用基于 transformer 的简单视觉运动策略。 -
关注分离:将系统 1 和系统 2 分离开来后,可以分别对每个系统进行迭代,而不必受制于寻找统一的观察空间或动作表示法。
免责声明:本号所载内容均为原创、投稿、授权转载或网络公开资料搜集整理,仅供读者交流学习使用,版权归原作者所有,且仅代表作者个人观点,与本号立场无关。若所引用的图片、数据、文字等来源标注有误或涉及侵权,烦请及时联系删除。
创建时间:2025-02-24 14:06
浏览量:0