关键词:
神经网络
模型反演攻击
人工智能安全
摘要:
大数据时代下,基于神经网络的模型研究是人工智能领域的一个主流方向。相比于其它的智能优化算法,神经网络具有自适应性强、泛化能力显著等优点,被广泛应用于语音识别、计算机视觉和自然语言处理等领域。然而,随着神经网络在各领域发挥关键作用的同时,也引发了隐私泄露、数据窃取等隐私安全问题。人工智能安全问题也随之成为当前国内外的研究热点。基于神经网络的模型反演攻击技术研究如何从神经网络模型输出数据中进行学习、推导,以得到有关输入数据的信息。通过对输入数据进行深度挖掘和关联分析,可能会还原出用户的重要敏感数据,从而引发更为严重的安全问题。同时,模型反演攻击技术也会推导出有关神经网络的网络结构和模型参数等信息,对神经网络模型的安全造成威胁。为了系统了解基于神经网络的模型反演攻击技术的研究进展和现状,本文对神经网络的安全问题及模型反演攻击技术研究进行了详细调研。首先,本文介绍了模型反演攻击技术的概念和常见攻击场景。然后,讨论神经网络面临的模型反演攻击挑战,包括原始数据保护、敏感数据泄露、模型训练隐私等安全问题。接着,对基于梯度优化和参数训练的两类神经网络模型反演攻击技术进行综述,对各类方法进行对比,并总结了典型的防御方法。最后总结全文并探讨了未来的研究方向。