关键词:
人体姿态估计
高分辨率网络
轻量化网络
GhostV2
坐标解码
摘要:
人体姿态估计被广泛应用于运动健身、手势控制、无人超市、娱乐游戏等诸多领域,但姿态估计任务仍面临着诸多挑战。针对目前主流的人体姿态估计网络参数量大、计算复杂度高的问题,提出一种基于高分辨率网络的轻量级姿态估计网络(LitePose)。首先,采用Ghost卷积降低特征提取网络的参数;其次,通过采用解耦的全连接(DFC)注意力模块,更好地捕获远距离空间位置像素间的依赖关系,减少由于参数量下降而导致的提取特征缺失,提高人体关键点回归的准确率;然后,设计一个特征增强模块,对骨干网络提取的特征进行进一步增强;最后,设计一个新的坐标解码方法,降低热图解码过程中的误差,提高关键点回归的准确率。在人体关键点检测数据集COCO和MPII上对LitePose进行验证,并与当前的主流方法进行对比。实验结果表明,LitePose相比基线网络HRNet精度损失0.2%,但参数量不及基线网络的1/3,LitePose在保证少量精度损失的同时能够大幅降低网络模型的参数量。