关键词:
深度网络
非线性系统辨识
先进控制
二阶优化算法
机理-数据驱动建模
摘要:
描述过程动态特性的模型是工业先进控制系统中的关键部分,模型的质量决定着控制品质的高低。由于工况变化和环境影响带来的随机干扰、测量过程带来的时滞以及化学反应过程复杂多变,使得工业过程具有多变量、非线性、时变性和强耦合等多种复杂特性。因此,完整且精确的工业过程机理模型是难以建立的,在实际应用中一般采用数据驱动的系统辨识方法获取过程的动态模型。然而,辨识实验通常需要对过程输入足够长时间的激励信号,这将严重干扰工业过程的正常运行。得益于深度学习技术的高速发展以及工业生产中分散控制系统(Distributed Control System,DCS)所能获取的海量过程数据,本文提出一种基于深度网络的复杂工业过程智能辨识方法。该方法通过历史运行数据而非人工测试数据建立能够准确反映出被控对象动态行为的虚拟装置,以作为先进控制实施过程当中测试被控对象动态模型的平台。首先,针对工业过程的复杂特性与工业数据的辨识价值稀疏性,构建了一套智能辨识框架。随后,进一步针对深度网络模型参数辨识算法效率低,模型缺乏物理意义且泛化能力差,以及数据分布偏移造成的模型失配等问题展开研究。主要工作包括:(1)面向工业数据的非线性过程深度网络辨识方法研究。针对工业过程的非线性、高维和强耦合特点,以及数据的高度时间关联和辨识价值稀疏等问题,基于时空注意力长短期记忆(Long Short-Term Memory,LSTM)网络结构建立了复杂工业过程被控对象的虚拟装置模型。该方法利用LSTM模型在处理复杂非线性时间序列数据方面的优势,同时引入时空注意力机制来发现隐藏在原始数据中的变量耦合和时滞信息。此外,提出了一种从多变量过程观测值中搜索辨识数据子集的方法,以减少工业数据的辨识价值稀疏性对过程辨识效果的不良影响。最后,以实际工业过程延迟焦化分馏塔过程为例证明了所提辨识方法的有效性。(2)工业过程智能辨识子采样递推二阶算法及混合策略研究。针对深度网络模型参数辨识效率低的问题,提出一种用于工业过程智能辨识的深度网络二阶优化算法。首先,利用多层全连接神经网络的反向传播和矩阵逆引理推导出包含真实二阶导数信息的Hessian逆矩阵递推方法,以克服一阶算法的病态问题及避免经典二阶算法的矩阵求逆操作,并据此推导LSTM网络权重更新方程用于后续辨识实验。此外,将子采样方法与递推二阶算法相结合,提出子采样递推二阶算法,降低二阶导数的高计算成本。为避免在所有训练轮次中计算Hessian逆矩阵,进一步提出子采样递推二阶算法与随机梯度下降算法混合训练策略。在实际工业过程延迟焦化分馏塔过程和吸收稳定过程数据集上的实验表明所提算法在保持模型准确性的同时,进一步缩短训练时间,提高了工业过程辨识效率。(3)基于自适应机理正则化深度网络的工业过程智能辨识方法研究。针对模型缺乏物理意义和泛化能力差的问题,提出利用已知机理对深度网络模型进行约束,实现机理与深度网络融合驱动的工业过程辨识。通常,工业过程包含的先验知识和机理方程并未体现在深度学习算法之中,从某种程度来说,这是一种信息资源的浪费。该机理与数据融合驱动的模型由深度网络和机理正则化部分组成,并通过引入微分方程自适应权重,提出一种自适应训练算法,在训练过程中主动关注误差较大的区域,以提升收敛速度。此外,提出了一种半监督训练方法以应对过程机理方程中某些参数未知的情况。最后,在p H中和过程和连续搅拌釜式反应器(Continuous Stirred Tank Reactor,CSTR)过程上的实验验证了该方法对于提升模型泛化能力的有效性。(4)基于领域泛化的工业过程智能辨识方法研究。受到环境变化、化学反应过程变化以及工况变化等因素的影响,实际工业数据的分布可能会发生偏移,并引发模型失配问题。对此,提出了一种基于领域泛化的工业过程智能辨识方法。根据最大熵原理,利用多核最大均值差异作为距离度量,将训练集划分为平均距离最大的数据段,以最大化每个数据段间的分布差异。针对工业数据中的多工况情形,将多核最大均值差异扩展到多源域情况下来度量不同数据片段的距离。以具有复杂非线性拟合能力且适用于时序数据的门控循环单元(Gate Recurrent Unit,GRU)为例,将多源域-多核最大均值差异领域泛化方法应用于GRU模型的训练,从而降低深度网络模型对辨识数据分布偏移的敏感性。在实际工业过程延迟焦化分馏塔过程和加热炉过程上的实验对比了基于GRU和LSTM等不同深度网络结构、不同数据分割方式及不同距离度量的辨识结果,验证了所提方法的优越性。综上所述,本文研究了一类适用于复杂工业过程的智能辨识方法,避免了在生产过程中实施先进控制方法时完全依赖人工测试方式获取控制模型的缺陷,并针对辨识过程中存在的以上问题提出了相应解决办法。