关键词:
自适应邻域
类间半径
类间系数
特征选择
邻域粗糙集
摘要:
邻域粗糙集模型被广泛应用于特征选择领域,然而传统邻域粗糙集模型受限于网格搜索法,且存在仅从特征角度确定邻域的粒度和特征评价函数构造视角单一等问题.针对上述问题,提出一种基于类间半径的自适应邻域特征选择方法.首先,提出类间半径的概念,从样本角度与特征角度出发,为不同类的样本生成相应的邻域半径,构造了基于类间半径的自适应邻域粗糙集模型,并基于此定义了自适应邻域互信息.其次,由类间边界引出类间系数,并将其与自适应邻域互信息结合,进而构造了类间互信息这一特征评价函数,该函数从代数和信息论视角评价特征.最后,设计一种基于类间半径的自适应邻域特征选择算法.通过在8个UCI数据集上与5种算法进行实验对比分析.实验结果表明,所提算法在选择的特征数量和分类精度上优于其他算法.