Figure推出视觉-语言-动作模型 通过语音指令让人形机器人做家务

admin 2025年03月21日 阅读数 60124

盖世汽车讯 据外媒报道,Figure创始人兼首席执行官Brett Adcock推出用于人形机器人的新机器学习模型——HelixHelix,这是一种“通用型”视觉-语言-动作(VLA)模型,将感知、语言理解和学习控制统一起来,以克服机器人技术领域的多项长期挑战。

Figure推出视觉-语言-动作模型 通过语音指令让人形机器人做家务
图片来源于网络,如有侵权,请联系删除

(图片来源:Figure公司)

VLA是机器人技术领域的新现象,利用视觉和语言命令来处理信息,例如目前比较有名的Google DeepMind的RT-2,通过视频和大型语言模型(LLM)组合来训练机器人。Helix的工作方式与之类似,将视觉数据和语言提示结合起来,以实时控制机器人。

版权声明

本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。