在线刊号(2320-9801)印刷刊号(2320-9798)
分类变量选择的筛选器和包装器方法与数据挖掘技术的比较
本研究的目的是评估高等教育数据库中毕业生就业能力的最重要特征,试图衡量泰国美若大学毕业生信息的就业能力状况。实验还应用了特征选择方法,提高了分类模型的整体效率。有两种通用的属性选择方法:Filter方法和Wrapper方法。滤波方法包括信息增益、增益比和卡方三种方法。包装器方法采用由遗传搜索、最佳优先搜索和贪婪逐步搜索组成的搜索方法作为随机搜索方法进行子集生成,包装了不同的贝叶斯分类器,即Naïve贝叶斯、带K2算法的贝叶斯网络、带TAN算法的贝叶斯网络和带Hill-climber算法的贝叶斯网络。结果表明,采用本文提出的包装器方法进行特征子集选择提高了分类精度。
邦锡·詹塔万,,蔡正发