Figure推出视觉-语言-动作模型通过语音指令让人形机器人做家务

admin 2025年03月21日阅读数 60124

盖世汽车讯据外媒报道，Figure创始人兼首席执行官Brett Adcock推出用于人形机器人的新机器学习模型——HelixHelix，这是一种“通用型”视觉-语言-动作（VLA）模型，将感知、语言理解和学习控制统一起来，以克服机器人技术领域的多项长期挑战。

Figure推出视觉-语言-动作模型通过语音指令让人形机器人做家务
图片来源于网络，如有侵权，请联系删除

（图片来源：Figure公司）

VLA是机器人技术领域的新现象，利用视觉和语言命令来处理信息，例如目前比较有名的Google DeepMind的RT-2，通过视频和大型语言模型（LLM）组合来训练机器人。Helix的工作方式与之类似，将视觉数据和语言提示结合起来，以实时控制机器人。

本文仅代表作者观点，不代表xx立场。
本文系作者授权xx发表，未经许可，不得转载。

Figure推出视觉-语言-动作模型 通过语音指令让人形机器人做家务