关键词:
皮尔森相关算法
云存储
层次化
冗余信息
去冗优化
摘要:
针对传统云存储存在去冗效率和召回率低的问题,提出了基于皮尔森相关算法的云存储层次化去冗优化方法。根据云存储层次化结构中冗余信息的属性分布相似性度量值,构建了冗余信息的距离矩阵;通过计算冗余信息之间的相似度,对云存储层次化冗余信息进行分类;通过分析不同类别冗余信息的结构,利用数据降维约束条件和中心极限原理,在云存储层次化结构中,构建冗余信息特征空间压缩的目标函数,提取出云存储层次化冗余信息特征;基于去冗优化超平面,计算冗余信息样本点到正负类超平面的距离;利用皮尔森相关算法定义模糊因子,据此定义云存储层次化结构中特征有效度,构建了冗余信息特征的有效度函数,实现了云存储层次化的去冗优化。实验结果表明,设计方法在提高去冗效率的同时,在召回率上也具有很好的性能。