关键词:
部分对查询
低秩分解
时间性能
空间性能
相似性
摘要:
CoSimRank递归地遵循类似SimRank的核心思想“如果两个节点被相似的节点所引用,则它们是相似的”,被认为是最有前途的评估节点间相似性的模型。然而,仅考虑全对、单对和单源搜索等的现有方法移植到部分对查询时存在许多冗余计算。因此,基于算法CSR+,提出高效可扩的部分对查询算法PP-CSR,缩短了CSR+的查询时间。首先,PP-CSR通过低秩分解实现维度约减,通过子空间上的迭代算法规避冗余计算;同时,利用节点的行列查询索引集R、Q以及矩阵的Hadamard积运算加快查询阶段的计算速度;其次,分析PP-CSR的计算复杂度并提供了合理的误差理论分析,弥补了CSR+无理论误差保证的缺陷。在公开数据集上验证,该文算法PP-CSR在时空性能上远优于其对比算法1到3个数量级。