关键词:
遥感目标检测数据集
数据集保护
版权保护
感兴趣区加密
目标生成水印
摘要:
遥感目标检测数据集的样本收集、清洗及标注过程通常需投入巨大成本,可被视为高价值的知识产权,而未授权使用或数据泄露会造成数据集拥有者的版权被侵权。为保护数据集版权,本文提出了一种基于后门水印和感兴趣区加密的遥感目标检测数据集版权保护算法。该算法通过将目标生成水印触发器嵌入原始数据集,并利用感兴趣区范围的置乱和添加扰动对数据集进行加密。在水印嵌入阶段,从原始数据集中随机选择任意样本,并将触发器嵌入样本的随机位置。数据集加密阶段分为3步,对标注文件中的感兴趣区范围进行初次加密,在加密的感兴趣区范围内添加扰动,以及基于用户独立密钥对感兴趣区进行二次加密。通过对关键信息感兴趣区进行加密而非全文加密提高算法效率,使用独立密钥降低密钥泄露风险提高安全性。在数据集分发使用阶段,授权用户可以将密文恢复为正确的感兴趣区;未授权用户若直接使用密文数据集则无法训练一个有效的模型。若发生数据泄密,恶意用户使用该数据集在训练模型时,后门水印信息会被植入模型。因此,在版权验证阶段,通过调用该模型的接口进行后门水印的验证,实现版权申明。大量试验证明,本文算法在不影响数据集质量的情况下,有效地保护了数据集版权,水印算法对微调攻击和剪枝攻击均具有较强的稳健性。