在线刊号(2320-9801)印刷刊号(2320-9798)
使用Hadoop的预测分析:一个调查
IT界的热门词汇是大数据(Big Data)。但“大数据”究竟是什么?任何使用传统RDBMS难以处理的数据量都可以被称为大数据。数据被认为是当今组织的未来资产。来自公共和私营部门的组织正在做出战略决策,使用这些数据来获得竞争优势。主要的障碍是为了分析目的而有效地处理这些巨大的数据。通过传统的关系数据库模型(RDBMS)对如此庞大的数据进行分析并从中获取信息,成本高且效率低。使用Hadoop框架可以实现成本效益和更快的数据处理,这将增强预测过程。通过本文,我们建议使用Hadoop框架和Hadoop的ET- L过程来执行基于数据集的预测。介绍了在Hadoop上使用Apriori算法进行数据分析的基本情况。
Shreyas Kudale, Advait Kulkarni, Leena A. Deshpande助理教授