关键词:
人类活动识别
压阻型智能织物
特征选择
机器学习
摘要:
压阻阵列型智能织物是一种测量表面压力的新型传感器,在人体活动识别领域具有丰富的应用场景。从一个粗糙的想法到实现一个新的智能织物应用,需经过硬件搭建、数据采集、软件搭建(数据预处理、特征提取、模型训练)三个环节,从中我们发现两个问题需要研究:1)在软件搭建环节的特征提取步骤,对特定的应用场景,研究人员往往根据经验,通过多次迭代针对性地构建和优化一组特征,这可能耗费研究人员大量的时间和精力,导致新应用的开发周期较长。对不同的应用场景,如何自动构建和优化特征集,加速应用开发?2)智能织物系统在不同场景下,在线识别实时性能需求不同,如何从软件层面,在保证较高识别精度的条件下,压缩数据处理的计算耗时,构建一个实时性强的系统?我们实现了一套软件工具包LwTool(Light-weight Toolkit),可根据用户设定的实时性能要求,从内部的特征库中自动选出分类性能优良的特征子集,压缩数据处理耗时,加速应用开发。同时,我们利用两类应用数据集Smart-Toy(动作识别)和Smart-Bedsheet(姿势识别)对工具包的可用性进行验证,工作如下:(1)通用特征库。我们构建了一套包含1830个时域和空间特征,适用于动作识别、姿势识别场景的通用特征库。基于十折交叉验证,该特征库在Smart-Toy和Smart-Bedsheet数据集上的平均准确率达89.7%和83.8%。(2)特征子集计算耗时估算算法。我们提出了一种可快速、准确地估算特征库中任意子集的计算耗时的算法,该算法基于一种“计算依赖图”的数据结构来分析每个特征从数据预处理到最终被计算的过程,并估算整个过程的平均耗时。该算法在Smart-Toy数据集上的平均估算准确率为97.2%,在Smart-Bedsheet数据集上的平均估算准确率为92.5%,运行时长控制在2.2毫秒内(即一秒可调用454次)。(3)考虑时间限制的特征选择算法。算法包含过滤层和前向选择层,在满足用户设定的时间限制(包含预处理、特征提取、模型预测)内,选出分类精度尽可能高的特征子集。该算法在Smart-Toy数据集达到最佳为89.7%的准确率,特征数量从1830减少到154个,处理速度提升约2.3倍,在Smart-Bedsheet 数据集达到最佳为 83.8%的准确率,特征数量减少到 71 个,处理速度提升约3.5倍,在保证较高的识别精度下,有效压缩数据处理耗时。在多种应用场景下,我们的工具包为快速构建分类精度高、实时性能强的智能织物在线识别系统提供一种通用解决方案。