关键词:
深度强化学习
近端策略优化
导纳控制
视觉伺服控制
MuJoCo仿真
摘要:
现代机械臂交互任务中,由于环境的复杂性和不确定性,精确的物体表面建模常常难以实现。因此,如何在不依赖精确模型的情况下,提高机械臂与环境交互时的适应性和稳定性成为机械臂与环境交互任务的研究重点之一。本文针对机械臂交互任务,旨在实现视觉引导下的精细力控。研究工作首先基于MuJoCo(Multi-Joint Dynamics with Contact)物理引擎搭建了机械臂交互仿真环境,并创新性的融合了基于位置的视觉伺服(Position-Based Visual Servo,PBVS)控制和导纳控制。通过深度强化学习(Deep Reinforcement Learning,DRL)中的近端策略优化(Proximal Policy Optimization,PPO)算法,有效整合了视觉信息和力信息,从而提出了一种结合了视觉感知的导纳控制策略。通过对比实验验证,结合视觉感知的导纳控制相较于视觉伺服控制,力控整体性能提升68.75%;相较于经典的导纳控制,峰值力控制精度提高15%。实验结果表明,结合视觉感知的导纳控制在平面和不规则凹面环境中均表现出色:不仅能精确执行视觉引导下的力控任务,还能在多样化的接触面上保持稳定的交互力并迅速适应环境变化。在精密装配、医疗辅助和服务机械臂等领域,能够提高机械臂在复杂、不确定环境中的适应性和稳定性,从而推动智能机械臂自主操作的进一步发展。