所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

研究文章雷竞技app下载苹果版

改进聚类公式以减少数据挖掘中的异常值

摘要

现有的数据挖掘研究大多集中在单聚类算法对数据的离群点检测上。在数据挖掘中,有很多方法可以通过将数据聚类来检测离群值,然后从中检测离群值。其中离群值是数据项的值超出样本数据的范围,这可能是异常数据。本文提出了一种既适用于数值数据又适用于文本数据的混合算法。我们的重点是改进聚类的生成,以减少异常值的数量,因为我们可以结合数据挖掘的聚类和分类技术,即加权k均值和神经网络。

Nancy Lekhi, Manish Mahajan

阅读全文下载全文|访问全文

全球科技峰会