ISSN在线(2320 - 9801)打印(2320 - 9798)
检测异常值在数据流中使用聚类算法
数据流是一个新的研究领域的到来在数据挖掘作为数据流是指从不停地提取知识结构的过程中,快速增长的数据记录。新兴应用程序涉及到数据流的动机是许多研究涉及连续大规模数据集如客户点击流,电子商务,无线传感器网络,网络监控、电信系统、股票市场和气象数据。处理这种类型的大数据,当前数据挖掘系统是不够的,处理这些问题,因此它会导致大量的计算和矿业由于硬件限制短缺的挑战。如今,许多研究人员专注于挖掘数据流和数据流分类,他们提出了许多技术数据流聚类,发现从数据流频繁项。数据流聚类和孤立点检测提供了许多发展的数据流环境中独特的挑战。数据流聚类算法非常有效地用于检测异常值。本研究工作的主要目的是执行聚类过程和检测数据流的异常值。在本研究工作中,两个与k - means聚类算法即治愈和治疗CLARANS用于发现数据流的异常值。不同大小和类型的数据集和两个性能等因素聚类准确性和孤立点检测的精度进行分析。通过分析实验结果,可以看出该治疗和CLARANS聚类算法的性能比现有算法更准确与k - means治愈。
美国博士Vijayarani p . Jothi女士