关键词:
可擦笔
高光谱
滤波器
希尔伯特变换
模式识别
摘要:
文件的真实性是当前诉讼审查阶段的重要工作,可擦笔在司法案件中常被用来进行伪造文书、合同等犯罪行为。针对其油墨成分、笔迹修改等方面的辨识是文件检验领域的重点研究。特殊热感变色颜料是可擦笔油墨的主要成分,其变色原理是随着温度变化会产生笔迹的消失与复现,在65℃以上颜色褪去,在-18℃以下颜色复现。对其进行种属认定可以对案件证据的真实性进行鉴别,为案件诉讼过程提供支持。高光谱的超高光谱分辨率对高分子材料具有较好的特征选择性,能够有效的对常见油墨成分进行数据采集。该实验收集22个品牌共45份可擦笔油墨样本,可以分为碳化钨笔珠、子弹头笔珠、全针管、半针管四种类型,统一采集450~950 nm波段的高光谱信息。关于光谱数据背景噪声冗余的问题,选用主成分分析法(PCA)对数据进行降维处理,提取特征变量。基于降维后的数据选用不同类型的希尔伯特变换(HT)进行信号滤波,进一步选择有效信号,提升建模效果。样本识别上选用多层感知器(MLP)和径向基函数神经网络(radial basis function neural network,RBFNN)两种人工神经网络模型,基于23维主成分提取的特征变量类建模准确率分别为81%,84%,通过希尔伯特高通滤波处理后可以将分类准确率提升至88.9%,92%,能够有效提升识别准确率。为进一步区分不同样本的种类,选择Fisher判别分析方法进行建模,各样本原始数据在FDA模型中识别准确率为44%,经最优PCA-HT处理的FDA建模准确率为93.3%,能够区分出不同的可擦笔油墨类型。结果表明,PCA能够在保留光谱有效信息的基础上进行降维,提升模型精度并且缩短运行时间,相较于原始光谱数据建模效果较好,通过希尔伯特变换后的光谱数据能够进一步完善有效光谱信息,使得建模准确率进一步提升。该实验确定PCA-HT-FDA模型为最佳可擦笔油墨高光谱识别模型,能够为司法鉴定人员提供一定参考。