关键词:
隐私集合运算
数据结构
同态加密
置换矩阵隐私等值检测
摘要:
随着云计算、物联网、人工智能等技术的不断发展,人们在享受着前所未有的便捷的同时也面临着隐私数据泄露的风险。安全多方计算允许互不信任的参与方在不泄露各自输入的前提下完成联合计算任务,是目前解决数据流通过程中数据安全问题的关键技术。隐私集合运算作为安全多方计算在集合运算场景下的专用协议,可在保证各个参与方输入隐私的情况下实现各类集合操作,包括计算交集、并集以及交集势等。隐私集合运算在隐私保护的数据挖掘、人类基因组研究、社交网络等场景有着广泛的落地应用。本文聚焦于隐私集合运算,主要研究内容包括:第一,隐私集合运算中的关键数据结构。高效的隐私集合运算协议的设计与多种高级的数据结构密切相关。然而,目前隐私集合运算中各种数据结构缺乏系统梳理且无同一平台上的效率对比结果。针对该问题,本文将常用的数据结构分为三类,分别是哈希表、过滤器和不经意键值存储。在明确各类数据结构的基本定义与构造方式的基础上,本文梳理各数据结构的主要功能作用、总结它们在不同协议中的典型应用,并提供各数据结构的性能对比分析与基准测试结果。第二,高效的非平衡隐私集合交集计算协议。在CCS 2018上,Chen等人首次考虑非平衡场景下的隐私集合交集计算协议。然而,该协议基于通用两方计算导致效率不高,且该协议仅仅只是理论上的成果,并没有给出具体实现。针对该问题,本文在基于全同态加密的特征分享协议基础上,结合Tu等人提出的置换矩阵隐私等值检测协议,构造了高效的隐私集合求交集势协议与隐私集合求交集势与和协议。本文的协议的通信复杂度均与大集合大小亚线性相关。此外,本文给出了基于C++的实现。实验结果表明,相较于目前已知最优协议,本文的协议在通信开销和运行时间上均有明显降低。以本文的隐私集合求交集势协议为例,其通信开销降低至目前最优协议的4%-49%,运行时间降低至目前最优协议的36%-50%。