关键词:
太赫兹
衰减全反射
主成分分析
支持向量机
摘要:
随着人口的增长和社会的迅速发展,水资源短缺和水污染问题日益严重。水质分类作为水质污染评估工作中的一项重要环节,其意义和作用也更加突出。基于太赫兹衰减全反射(THz-ATR)光谱和模式识别技术,提出了一种水质分析模型。利用太赫兹时域光谱系统和衰减全反射模块测量了纯净水、自来水、河水、海水A和海水B五种水样的太赫兹衰减全反射光谱,通过光学参数提取模型获得0.2~1.0 THz频率范围内五种水样的折射率、吸收系数、介电常数实部和介电常数虚部。利用主成分分析(PCA)对折射率进行降维和特征提取,分别作出样品在第一、二主成分上的二维得分图和前三个主成分上的三维得分图,结果显示,基于折射率的主成分得分图可以明显的区分不同的水样。为了进一步对不同水样进行准确分类,将降维之后的数据输入到支持向量机(SVM)中构建水样分类模型,每种水样随机选取其中的五分之三作为训练集,剩余的数据作为测试集,同时引入网格搜索(GridSearch)、遗传算法(GA)和粒子群(PSO)三种优化算法对支持向量机参数进行优化。结果显示,基于网格搜索算法的支持向量机最优参数c和g分别为1.4142和2.0,准确率为99.0%;基于遗传算法的支持向量机最优参数c和g分别为1.6754和5.9665,准确率为99.5%;基于粒子群算法的支持向量机最优参数c和g分别为3.1549和12.589,准确率为100%。可以看出,使用不同的优化算法得到的最优参数不同,所构建的支持向量机分类模型都可实现正确的分类,且分类准确率均高达99.0%以上。研究结果表明,利用粒子群优化算法基于折射率构建的PCA-SVM分类模型效果最优,可以准确识别不同水样,为水质分类奠定了基础。