关键词:
反洗钱
图神经网络
注意力机制
门控循环单元
摘要:
洗钱指犯罪分子通过金融手段,将非法所得资金伪装成合法收入的行为。基于规则的洗钱检测算法在很大程度上依赖金融专家的经验与政策规则的审查,效率低下,且在面对海量交易数据中的洗钱活动时往往难以奏效,存在显著的局限性。目前机器学习技术在反洗钱领域应用广泛,并在特定情境下展现出卓越的性能。然而这些算法通常依赖于预先设定的特征,难以捕捉复杂的、动态的非线性关系和网络结构中的潜在模式。在识别复杂的洗钱网络和跨多个账户、交易的关联性时,效果不佳,无法兼顾交易网络中的拓扑结构,账户信息,交易信息和时序信息。为解决上述问题,本文针对银行转账中的洗钱行为提出了两种基于图神经网络的洗钱检测模型。
为了进一步同时捕捉交易网络中的拓扑结构,账户信息和交易信息,首先提出了基于交易网络节点嵌入的特征增强图注意力网络(Feature Enhanced Graph Attention Network,FEGAT)。在数据预处理模块中,将交易数据建模为有向图,其中节点代表账户,边代表交易。FEGAT对交易图中的节点进行特征聚合。为识别可疑交易,引入注意力机制,使模型能够有选择性地聚合邻居节点的特征。在聚合过程中,以权重的形式引入边特征,并与注意力系数相乘,从而获得边的聚合权重。针对多维度的边特征,使用分治拼接的策略,利用了边的每一维特征,提高了模型的表达能力,并使用XGBoost分类器提升模型分类能力。
考虑到FEGAT在面对随时间动态变化的交易网络时表现欠佳,本文在FEGAT基础上进一步提出了考虑整合时空交易信息的动态特征增强图注意力网络(Dynamic Feature Enhanced Graph Attention Network,DFEGAT),该模型能够在时间维度上分析数据中账户和交易的动态变化,并据此学习到犯罪者的行为模式,据此来完成洗钱检测任务。DFEGAT首先在FEGAT基础上引入异常检测模块,输出账户是否异常,并将检测结果增强到FEGAT的输出特征;之后借助GRU模块以分析时序信息,将每个时间片内的转账交易信息输入到GRU中,学习犯罪分子长时间的交易规律;最后,将GRU的输出与长时间段的统计交易数据拼接,得到了账户的综合特征,用XGBoost分类器模块对账户进行分类,判定账户是否涉嫌洗钱犯罪。
本文使用了IBM Watson实验室广泛应用于反洗钱研究的AMLSim模拟器生成的模拟数据,数据持续两年,涉及12000个账户,150000笔交易,共有约700个账户,600笔交易涉嫌洗钱。实验结果表明,本文提出的模型在准确率等指标上优于其他算法。进一步的,通过注意力机制尝试探索模型可解释性,借助模型内部的注意力权重,判断大额交易或频繁交易等,为模型的结果增加了一定的可解释性。此外,为了让模型能够长时间有效运行,本文验证了模型的再训练过程的有效性,为长期的反洗钱任务提供了支持。