关键词:
三维荧光
油田采出水
多环芳烃
多维校正
实时定量
摘要:
随着现代工业的发展,石油产品的需求量日益增长。这会加快石油的开采速度与力度,同时在开采中也会伴随着各种污染物的产生。油田采出水是石油开采中的一种最为典型的油田废水。它的成分复杂,包括原油、有机物、无机物、重金属以及微生物等。在油田采出水中,多环芳烃(polycyclic aromatic hydrocarbons,PAHs)是一种常见的有机污染物。这类物质对人类的身体健康具有(遗传)毒性、致癌致畸性和致突变性,可造成呼吸系统、循环系统、神经系统的不可逆损伤,也能够对肝脏和肾脏造成严重的损害。同时,油田采出水的滥排和漏排等行为会对环境中的水体和土壤造成污染,也会直接或间接危害人体安全。因此,迫切需要建立一种追踪油田采出水来源的方法或技术,以及开发一种简单快速的方法或技术来检测油田采出水中的PAHs。
鉴于此,本论文开展了基于三维荧光(又称激发-发射矩阵荧光(Excitation-emission matrix fluorescence,EEMF))光谱的油田采出水溯源和PAHs检测方法研究,主要包括四个方面的内容:
在第二章中,本论文首先从理论方面介绍了EEMF光谱的基本原理和测量方法,并引出了新的数据处理和分析方法,即三维校正算法。此类方法具有“二阶优势”,可以在有未知干扰共存的情况下实现多目标分析物的同时定量分析,以“数学分离”代替或简化“物理和化学分离”。通过结合EEMF数据,三维校正算法能够将其分解为三个分别与激发、发射光谱和样本浓度相关的矩阵。而利用分解得到的这些信息,就可以进一步实现复杂体系中感兴趣成分的定性和定量分析。
在第三章中,本论文提出了使用化学计量学算法和深度学习算法结合EEMF光谱对油田采出水进行溯源的新方法。一方面,使用交替三线性分解(Alternating Trilinear Decomposition,ATLD)和主成分分析(Principal Component Analysis,PCA)首先对去除散射后的EEMF数据进行分解。ATLD可以将EEMF数据分解为具有实际化学意义的组分,并生成了代表所有组分相对含量的得分矩阵。PCA可以将EEMF数据提取为能够代表原始数据的绝大部分有效信息的主成分。通过将得分矩阵或者主成分输入到支持向量机(Support Vector Machine,SVM)和偏最小二乘判别分析(Partial Least Squares Discriminant Analysis,PLS-DA)中来进行油田采出水的溯源。另一方面,直接将去除散射后的EEMF数据输入到能够直接应用于多维数据分类的多维偏最小二乘判别分析(N-Way Partial Least Squares Discriminant Analysis,N-PLS-DA)中进行油田采出水的溯源。总共进行了5种化学计量学模型的溯源研究,结果表明,每一种模型都能够正确的将每一个油田采出水样本归属到其原本正确的类别。此外,考虑到使用EEMF数据中异常值、缺失值等存在可能会导致分类模型的建模失败或者性能低下,因此使用EEMF图像结合当下热门的卷积神经网络(Convolutional Neural Network,CNN)来进行油田采出水的溯源研究。为了获取大量样本,通过模拟误差矩阵的方法对EEMF图像进行扩增,最终额外获得了4950个EEMF图像。训练集、测试集和外部验证集的优秀预测结果表明,CNN结合EEMF图像在油田采出水的溯源方面同样具有巨大的潜力。
在第四章中,本论文针对油田采出水中两大典型物质:PAHs和表面活性剂进行了研究。考虑到PAHs的EEMF信号可能会受到表面活性剂的影响,引入了十二烷基苯磺酸钠(Sodium Dodecyl Benzene Sulfonate,SDBS)这一表面活性剂来调制PAHs的EEMF信号。基于SDBS浓度,构建了激发×发射×表面活性剂浓度×样本的四维EEMF数据,并将其应用于油田采出水中PAHs(芘、芴、菲和荧蒽)的准确定量。使用两种四维校正算法即四维平行因子分析算法(Four-Way Parallel Factor Analysis,4-PARAFAC)和交替加权残差约束四线性分解算法(Alternating Weighted Residue Constraint Quadrilinear Decomposition,AWRCQLD)对四维数据进行解析,同时使用两种三维校正算法即平行因子分析算法(Parallel Factor Analysis,PARAFAC)和自加权交替三线性分解算法(Self-Weighted Alternating Trilinear Decomposition,SWATLD)算法分析三维数据作为比较。分析含有干扰四维数据集的结果表明,4-PARAFA