| 
 
| 羽毛球机器人通过先进的视觉系统和精准的运动控制算法,来实现“看得清”和“动得准”。具体如下:看得清:    开发感知噪声模型:现有商用机载相机在运动稳定性等方面远逊于人眼,为实现有效视觉追踪,研究团队开发了感知噪声模型。该模型可量化机器人抖动、旋转等运动状态对目标追踪的影响,使机器人能适应动态模糊、目标遮挡等干扰,即便目标因高速运动或遮挡短暂消失,也可基于历史运动轨迹持续预测其位置。    主动调整追踪角度:当羽毛球高速飞离视野中心时,机器人会主动调整身体俯仰角度,将目标保持在相机视野内,以优化追踪效果。    采用高精度视觉系统:部分羽毛球机器人配备了双目视觉系统和高清摄像头,如Robomintoner羽毛球机器人,其通过双向高清摄像头捕捉影像,经计算后羽毛球落点位置预测精度小于5mm,能快速且精确地捕捉运动物体。动得准:    构建统一控制框架:传统运动机器人将移动与操作任务分离,难以应对复杂动态环境。而羽毛球机器人通过基于强化学习的统一控制框架,将主动感知、移动和操作功能整合为一体,可同步协调机器人周身多个关节的运动,根据来球的时间和距离,自主调整步态和击球方式。    运用强化学习算法:利用近端策略优化(PPO)算法,训练一个联合控制机器人关节的策略网络。采用非对称Actor - Critic架构,Critic能访问球的真实位置等“特权信息”,以获得更稳定的训练反馈;Actor仅基于机器人部署时可获得的感知信息进行动作输出,提升训练效率并保持策略的可部署性。    引入感知误差模型:在训练中引入基于实测数据回归的感知误差模型,考虑观测角度、距离、球速对测量误差的影响,并在仿真中为每次观测引入高斯噪声扰动,增强了策略对现实感知条件的鲁棒性,还使机器人能通过躯干姿态调整保持球在视野中央,击球前微调站位以减少预测误差。    设计合理训练机制:奖励函数除击中球的核心奖励外,还设计多个辅助项,用于鼓励策略提前接近预测击球点、控制步态稳定性等。同时,提出多目标摆动训练范式,让机器人学习击球后的姿态收敛和过渡动作的快速调度,模拟真实对战场景,使其能更好地适应实际比赛情况。 
 | 
 |