颠覆性科技投资丨Figure AI把人形机器人行业推到新技术高度

在通用人形机器人的应用场景中,“整理客厅”一直被视为一项极具挑战性的任务。

与结构化的商业或工业环境不同,客厅是一个高度动态且无序的非结构化环境:物品散落随机、家具构成的导航空间狭窄,且充斥着毛巾、靠枕等物理形态难以预测的柔性物体。

然而,继上个月成功演示厨房清理任务后,美国明星机器人初创公司Figure AI再次迎来技术里程碑。

其搭载最新Helix 02视觉运动大模型的人形机器人,成功实现了长周期、高复杂度的客厅自主整理任务。

这一演示甚至引起了埃隆·马斯克的高度关注。

面对马斯克关于“这是全自动还是远程遥控”的询问,Figure AI创始人Brett Adcock给出了明确的答复:完全自主(Fully Autonomous)。


图片


01 核心驱动:端到端架构与单一神经网络


此次技术突破的核心,在于硬件载体(Figure 03)与AI大脑(Helix 02)的深度结合。

传统机器人在执行复杂任务时,往往需要工程师为每一个独立动作(如抓取、行走、放置)编写专门的控制算法和状态机。

而Helix 02采用的是单一神经网络系统,直接实现了从“像素(视觉输入)到动作(关节控制)”的端到端映射。


图片

据披露,该模型通过吸收大量人类运动数据进行训练,使其能够直接从数据中学习环境交互策略。

系统不再依赖硬编码的特殊情况处理逻辑,而是通过纯粹的数据驱动,在移动、感知与灵巧操作之间实现了无缝整合。


02 关键技术能力验证


在最新披露的演示中,Helix 02展现了在不增加新算法的前提下,仅靠数据扩张即可获得的卓越泛化能力:

  • 工具协同与力度控制:机器人能够流畅地左手使用喷雾瓶润湿桌面,右手持毛巾进行施加下压力的擦拭动作,展现了优秀的力控与双臂协同。

  • 柔性物体的动态处理:针对动态变化极大的柔性材料(毛巾),机器人能够完成从手臂取下、调整清洁姿态、甚至将其甩至肩部以释放双手的复杂物理交互。

  • 复杂双臂并发操作:在双手端稳收纳盒的同时,利用其中一只手将桌面散落的积木拨入盒中,打破了机械性的交替动作逻辑。

  • 全身协同:采用类似人类的身体资源调度策略,例如将收纳盒夹在腋下,从而腾出双手去拾取其他物品,大幅提升了任务效率。

  • 高动态动作执行:以快速且受控的抛掷动作,将靠枕精准扔回沙发,展现了超越常规缓慢移动的动态操作能力。

  • 灵巧手内重定向:抓取遥控器后,利用灵巧手在掌内完成姿态调整,并精准按压特定按键关闭电视。

  • 移动操作:完美解决了业界公认的难题——在茶几与沙发之间的极窄缝隙中进行侧步导航的同时,上肢依然能稳定执行抓取和放置任务。


图片


03 行业意义:迈向可扩展的通用智能


整理客厅这一任务,深度融合了机器人的移动能力、灵巧操作、工具使用以及实时路径规划。

Figure AI与Helix 02的成功,验证了通用架构在复杂物理世界中的可行性。

它证明了系统不需要为每一种行为设计定制化的控制器,而是可以直接从数据中涌现出解决策略。

随着训练数据的指数级增长,Helix 02的技能库将持续扩展。

这标志着具身智能正朝着“可扩展性”迈出关键一步——未来,只需让单一模型“观察”并学习更多真实世界的样本,通用人形机器人便有望胜任家庭与商业场景中的全品类任务。