关键词:
轮毂磨抛
运动控制系统
逆运动学
参数辨识
动力学模型
轨迹规划
PPO强化学习
摘要:
随着工业自动化的蓬勃发展,工业机器人以其低成本、高效率等诸多优势逐渐广泛应用。在工业机器人实现轮毂磨抛作业环境中,往往是基于位置控制进行磨抛作业,这种方式通常由人工示教磨抛路径点的速度和加速度,往往示教效率很低,同时该方式也不能有效利用电机性能更高效运行。如果要进一步提高示教效率和作业效率,并且能避免未知的振动产生,则需要从动力学角度进行时间轨迹规划。本文以此为背景,对磨抛运动控制系统、偏置手腕逆运动学、动力学模型及其参数辨识和基于动力学模型的轨迹规划等内容展开了研究。旨在针对实际磨抛加工等工业环境下,研究六自由度机器人的轨迹规划问题,完成在力矩限制条件下的轨迹规划,提供理论示教参考轨迹,以提高示教效率和工作效率。本文所完成的主要工作如下:
针对磨抛机器人工业领域没有开放式和扩展式的运动控制系统,设计了一个运动控制系统架构,设计了其人机交互和通讯实现方式,并搭建了实验平台。针对本系统偏置机器人手腕结构,提出了偏置补偿法结合牛顿迭代法的数值解法求解逆运动学,实现了高精度以及快速求解目标,同时,采用随机点和轮辐表面采样点进行了仿真和实验,验证了算法的性能,进一步也验证了运动控制系统的实时性。
通过构建机器人拉格朗日动力学方程,建立并验证了最小参数集形式的动力学模型的正确性,再基于条件数最小优化原则,通过遗传算法求解出了一组五次傅里叶级数激励轨迹,最后,运行激励轨迹,对采集数据进行滤波处理,通过最小二乘法辨识机器人动力学最小参数。
为提高人工示教作业的示教效率和提高加工效率,着手于离散路径下的基于动力学模型的轨迹规划问题,将离散路径的位置和姿态做二次离散,从关节空间转移到参数空间,并在关节力矩约束条件下求得每一个离散点的允许加速度区域,通过二分法求解出这些点的最大加速度,绘制离散最大速度限制曲线,针对姿态变化大的磨抛路径以及因差分带来的加速度突变导致求解失败的问题,提出改进离散数值积分方法,成功规划出了机器人运动轨迹,为示教轨迹的速度和加速度提供了理论的参考值。
针对数值积分方法在寻找关键加速度切换点困难问题,提出了强化学习轨迹规划的方法,将在最大速度限制下的相平面轨迹规划问题表达成一个强化学习可解的环境,并设计了其状态空间和动作空间,设计了归一化的动作空间将动作与环境解耦,通过设计的奖励函数,使用PPO强化学习算法对轮缘路径进行轨迹规划,成功规划了一条运动轨迹,并通过实验验证了所提出方法的可行性和正确性。
对离散数值积分方法和PPO强化学习算法实现的基于动力学模型的轨迹规划仿真轨迹进行了实验验证,同时也验证了动力学模型参数辨识的正确性。