Issn online (2320-9801) print (2320-9798)
FI-DBSCAN:基于密度空间聚类的频繁项集超尺度树:基于Mapreduce的大数据噪声应用
由于数据量巨大,数据挖掘变得越来越重要。在某些情况下,从仓库中检索信息不仅繁琐而且困难。现有算法计算速度慢,结果不理想。该系统使用基于密度的空间聚类的频繁项集,通过将候选列表中的项映射到根据支持度划分的桶(称为哈希表结构)中来计算支持度。当遇到新的项目集时,如果项目之前存在,则增加桶数,否则插入到新桶中。因此,最终从候选集中删除支持计数小于最小支持的桶。
V.Swathi Kiruthika, v . thiagarasu博士
阅读全文下载全文