苹果公司近期在机器人训练技术方面取得了创新性突破,这一消息由科技媒体AppleInsider在5月21日率先报道。据悉,苹果在其最新发布的研究论文《Humanoid Policy ~ Human Policy》中,详细介绍了一种名为“PH2D”的全新训练方法。
PH2D方法,即“物理人与人形机器人数据”方案,旨在解决传统人形机器人训练中存在的效率低下和成本高昂问题。传统方法主要依赖机器人示范者,这一过程被形容为“劳动密集”,且需要大量远程操作数据采集,成本不菲。
苹果的新方法则巧妙结合了人类教练和机器人示范者的优势。通过使用经过改造的消费级设备,如Apple Vision Pro头显和meta Quest头显,制作高效的训练素材。Apple Vision Pro头显被特别调整,仅使用左下角摄像头进行视觉观察,并结合ARKit技术获取3D头部和手部姿态数据。而meta Quest头显则搭载了mini ZED立体摄像头,成为了一种低成本的训练工具。
人类教练通过这些设备记录各种手部操作,如抓取、抬起物体以及倒液体等动作,并在录制过程中提供语音指导。这些视频素材在放慢速度后,被用于机器人的训练。苹果还开发了一个名为“Human-humanoid Action Transformer”(HAT)的模型,该模型能够同时处理人类教练和机器人示范者生成的数据。
HAT模型构建了一个通用的策略框架,相比仅使用真实机器人数据的训练方法,其表现出了更好的泛化能力和稳健性。研究表明,在特定任务,如垂直抓取物体中,这种结合训练策略的效果明显优于单一机器人示范者训练。苹果的研究还显示,这种结合训练方式不仅具有更高的成本效益,还能显著提升机器人的表现。
尽管目前苹果仅展示了机器人灯原型,但有传言称,该公司正在研发面向终端消费者的移动机器人。这些机器人预计将能够执行家务和简单任务,为人们的生活带来便利。