关键词:
联邦学习
混合拜占庭攻击
多特征检测
动态分配权重
鲁棒聚合算法
摘要:
联邦学习作为一种保护隐私的分布式机器学习范式,允许多个客户端在不泄露原始训练数据的情况下协同训练全局模型。然而,由于无法直接访问客户端本地训练数据和无法监控本地训练过程,联邦学习面临各种拜占庭攻击的威胁,如数据中毒和模型篡改攻击。这些攻击旨在扰乱联邦学习模型训练过程,降低模型性能。针对此问题,尽管已有许多研究提出了不同的聚合算法,但这些方法主要聚焦于单一拜占庭攻击场景,而忽略了实际环境中可能出现的混合拜占庭攻击所带来的威胁。为应对这一难题,受净水器的原理启发,提出了一种基于多特征检测与自适应权重调整的新型拜占庭鲁棒聚合算法FL-Sieve,旨在通过多层次的筛查过滤恶意客户端。首先,算法通过角幅相似度和模型边界测度评估客户端间的特征相似性,生成相似度矩阵并计算相似性分数;接着,利用聚类算法将相似的节点归入同一簇,以确保相似的节点能够被正确分类;随后,根据预定义规则筛选潜在良性客户端;最后,根据每个客户端的信任度智能地分配权重,进一步增强防御效果和系统鲁棒性。为了验证FL-Sieve的性能,实验利用了MNIST,Fashion-MNIST和CIFAR-10这3种数据集,考虑了Non-IID数据分布情景和混合拜占庭攻击场景。混合拜占庭客户端的数量从20%递增到49%,以模拟大规模混合拜占庭客户端攻击的场景。同时也对FL-Sieve在IID和Non-IID数据分布以及单攻击场景下的性能进行了测试。实验结果表明,FL-Sieve能够有效抵御不同场景下的拜占庭攻击,即使在高达49%的混合拜占庭客户端攻击下,FL-Sieve依然能够维持较高的主任务准确率。相比之下,几种现有的经典算法存在不同程度的失效,凸显出FL-Sieve的优势。