Figure AI人形机器人的多模态能力升级,特别是其“听懂”语音指令并将食物轻松放进冰箱的能力,标志着人形机器人在智能家居和日常生活辅助领域取得了重要进展。以下是对这一升级能力的详细分析:
一、技术升级背景
Figure AI作为人形机器人领域的创新企业,一直致力于提升机器人的智能化水平和实用性。此次多模态能力升级,是Figure AI在技术研发上的又一重要突破。
二、技术升级内容
引入Helix人工智能系统:
Figure AI推出了名为Helix的新型人工智能系统,该系统结合了两个关键的人工智能模块。第一个模块是一个拥有70亿参数的多模态语言模型,能够以7至9赫兹的频率处理语音和视觉信息,充当机器人的“大脑”。第二个模块则是一个拥有8000万参数的AI,负责将语言模型发出的指令转化为精确的机器人动作,频率高达200赫兹。
提升多模态处理能力:
Helix系统能够同时控制35个自由度,涵盖了从单个手指动作到头部、躯干等多个部分的精细控制。这使得机器人能够更准确地理解和执行复杂的语音指令。
降低训练数据需求:
Helix系统只需500小时的训练数据,远低于同类项目的要求。这降低了机器人部署和应用的成本,提高了商业应用的可行性。
三、技术升级效果
语音指令理解更准确:
机器人能够更准确地理解人类的语音指令,包括复杂的任务和场景描述。在官方公布的演示视频中,两台机器人在一个展示厨房中合作,将食物放入冰箱,且全程无需为这些物体进行任何特定的预先训练。
动作执行更流畅:
机器人能够将语言模型发出的指令转化为精确的动作,执行过程流畅且准确。这提高了机器人在日常生活中的实用性和用户体验。
适应新情境能力更强:
与传统机器人每次执行新任务都需要重新编程不同,Helix系统能够轻松适应新的情境。这使得机器人在面对不断变化的环境和任务时更加灵活和智能。
四、未来展望
Figure AI人形机器人的多模态能力升级为人形机器人的未来发展提供了广阔的空间。随着技术的不断进步和应用场景的不断拓展,人形机器人有望在智能家居、医疗护理、教育陪伴等多个领域发挥更大的作用。同时,这也将推动人工智能技术的进一步发展,为人类社会带来更多的便利和进步。