关键词:
社交网络
链路预测
增量学习
时序随机游走
概率模型
摘要:
社交网络中,节点间存在多种关系类型,节点数量会随着时间的推移而变化,这种异质性和动态性给链路预测任务带来极大的挑战。因此,本文提出一种基于增量学习的社交网络链路预测方法(incremental learning social networks link prediction,IL-SNLP)。通过对网络进行分层,使每一层网络只包含一种关系类型,以更好地获取节点在每种关系类型下的语义信息;针对网络的动态性,利用时序随机游走捕获社交网络中的局部结构信息和时序信息;针对增量数据,采用增量式更新随机游走策略对历史随机游走序列进行更新。通过增量式skip-gram模型从随机游走序列中提取新出现节点的特征,并进一步更新历史节点的特征;针对网络的异质性,采用概率模型提取不同关系类型之间的因果关系关联程度,并将其作用于每一层的节点特征,以改善不同关系层下节点特征表现能力;利用多层感知机构建节点相互感知器,挖掘节点间建立连接时的相互贡献,实现更高的链路预测准确率。实验结果表明,在3个真实的社交网络数据集上,IL-SNLP方法的ROC曲线下的面积(AUC)和F1分数比基线方法分别提高了10.08%~67.60%和1.76%~64.67%,提升了预测性能;对于增量数据,只需要少次迭代就能保持预测模型的性能,提高了模型训练的速度;与未采用增量学习技术的IL-SNLP−方法相比,IL-SNLP方法在时间效率上提升了30.78%~257.58%,显著缩短了模型的运行时长。