石头:2229 - 371 x
二项数据集特征选择数据挖掘分类器的分类与比较研究
本文介绍了不同的数据挖掘分类器在二项数据集上进行特征选择前后的性能分析。本文采用逻辑回归、支持向量机和神经网络三种数据挖掘分类器进行分类。国会投票记录数据集是本研究调查的二项数据集,取自UCI机器学习存储库。所有分类器的分类性能通过使用准确性、特异性和敏感性等统计性能度量来表示。增益图和接收机工作特性图也被用来衡量分类器的性能。对各种数据挖掘分类器进行了比较研究。实验结果表明,在没有特征选择的情况下,逻辑回归和SVM分类器在测试数据集上的准确率为100%,神经网络的准确率为98.13%。具有特征选择的SVM分类器提供100%的准确率。在特征数量减少的分类器中,SVM分类器的性能是最好的。
Pushpalata Pujari