ISSN在线(2320 - 9801)打印(2320 - 9798)
决策树学习与错误修正区间数值属性的值在训练数据集
分类是数据挖掘中最重要的技术。决策树是最重要的分类技术在机器学习和数据挖掘。数据测量误差是常见的在任何数据收集过程中,特别是当训练数据集包含数值属性。值的数值属性包含数据测量误差在许多训练数据集。我们延长某些或传统或经典的决策树构建算法来处理数值属性的训练数据集包含了测量误差。我们已经发现,特定的分类精度或古典或传统的决策树分类器可以大大改善了如果数据测量误差在数值(或连续)属性的值在训练数据集是正确适当地控制(纠正或处理)。本研究提出了一种新的决策树分类器构造算法。这个新算法命名为间隔决策树(IDT)分类器结构。IDT分类更准确,效率比特定的或传统的决策树分类器。每个值的区间构造每个属性在训练数据集和区间内最好的错误纠正值近似熵计算。 Extensive experiments have been conducted which show that the resulting IDT classifiers are more accurate than certain or traditional or classical decision tree classifiers.
c . SUDARSANA REDDY s AQUTER先生诉VASU博士
阅读全文下载全文