摘要:
在大数据时代,数据正呈现出指数级增长趋势。数据间的类别层次结构使得分类学习任务更有效率。现有的分层分类特征选择算法未充分体现出类内特征的判别性,因此本文提出了一种基于正交约束和最大化类内特征判别性的分层分类特征选择算法(Hierarchical Classification Feature Selection Algorithm Based on Orthogonal Constraints and Intra-class Maximum Feature Discriminability,HFSOC)。该算法在使用稀疏正则化项去除不相关特征后,利用改进后的正交约束公式来度量类间独立性,并将每个内部节点特征矩阵的各个列向量互相正交,以提高类内特征的判别性。最后,利用递归正则项优化输出特征权重矩阵。实验结果表明,本文所提算法在5个数据集上取得了一定的效果,其分类准确率在DD数据集上相比于HFisher算法提高约17%,在F194数据集和CLEF数据集上相比于基于?2,1范数最小化的高效鲁棒的特征选择算法(HFSNM)均提高约10%,在ILSVRC数据集上相比于HFSNM算法提高约1%。