所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

调查的数据挖掘技术在农业

M.C.S.Geetha
助理教授,计算机应用部门,Kumaraguru技术学院,印度哥印拜陀。
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

农业是最重要的应用领域特别是在像印度这样的发展中国家。使用农业信息技术可以改变决策的情况,农民可以得到一个更好的方法。数据挖掘的决策中扮演着关键角色在一些农业领域的相关问题。本文讨论了数据挖掘在农业领域和角度也带来了一些数据挖掘技术及其相关工作由几个作者在农业领域的上下文。它还讨论了在不同的数据挖掘应用程序在解决不同的农业问题。它集成了不同作者的工作在一个地方它有助于研究人员获取信息的当前场景的数据挖掘技术和应用程序上下文农业领域。本文提供了各种数据挖掘技术用于农业的调查包括人工神经网络、K -最近邻,决策树,Bayesion网络、模糊集、支持向量机和K -意味着[1]。

关键字

农业,数据挖掘,人工神经网络,K最近邻,K,决策树,Bayesion网络、支持向量机、模糊集。

介绍

农业是印度国家的支柱。尽管在印度大面积的事实已经得到灌溉,只有三分之一的裁剪部分得到灌溉。农业生产率很低。作为食品的需求不断增加,研究人员、农民、农业科学家和政府正试图把额外的努力和更多的生产技术。因此,农业数据增加一天。随着数据量的增加,它需要自愿为这些数据在需要的时候被提取。时至今日,极少数农民实际上是使用新的方法、工具和技术更好的农业生产。数据挖掘可以用于预测未来趋势的农业的过程。
数据挖掘的过程,结果发现新模式在大型数据集。数据挖掘过程的目的是提取知识从现有的数据集,并且转换成人类可以理解的形成推动使用。它是一个过程,从不同的角度分析数据,总结成有用的信息。没有限制的数据类型可以通过数据挖掘分析。
可以分析数据在关系数据库中,数据仓库,web服务器日志或一个简单的文本文件。有效的方法分析数据需要适当的数据挖掘技术的理解。本文的意图是给细节不同的数据挖掘技术在农业领域的角度这样研究人员就能在上下文中适当的数据挖掘技术的细节工作区域。
数据挖掘的任务可以分为两类:描述数据挖掘和预测数据挖掘。描述性数据挖掘任务描述数据库中的数据的一般性质,预测数据挖掘是基于模式用来预测显式值确定已知的结果。预测需要使用数据库中的一些变量或字段来预测未知或感兴趣的其他变量的未来值。就数据挖掘技术问题;在大多数情况下使用预测数据挖掘方法。预测数据挖掘技术用于预测未来农作物,天气预报,杀虫剂和肥料使用,生成收入等等。
收益率预测问题可以解决了采用数据挖掘技术,如K, K最近邻(资讯)、人工神经网络和支持向量机(SVM)。研究论文旨在发现合适的数据模型,实现高精度和高通用性对四个参数即降雨、产量和播种面积。为此,不同类型的在不同的数据集的数据挖掘技术进行评估。[2]
本文的组织结构如下:第二章讨论了数据挖掘的方法。第三章论述了数据挖掘技术在农业领域的应用。第四章讨论了结论。

方法

数据挖掘的主要技术包括关联规则、分类、聚类和回归。不同的数据挖掘技术用于解决不同的农业问题已经讨论了[3]。不同的数据挖掘技术的图形表示如图1所示。

关联规则挖掘

关联规则挖掘技术是一种最有效的数据挖掘技术来搜索之间的看不见的或期望的模式的大量数据。在这种方法中,重点是找到不同的事务数据库中的条目之间的关系。关联规则是用来找出反复共现的元素组成的一个数据集内许多独立选择的元素(如采购事务),并发现规则。简单的问题陈述是:给定一组的事务,每个事务是一组文字,关联规则是一个短语的形式X = > Y, X和Y是集的对象。的本能的意义这样一个规则是,事务的数据库包含X往往包含Y。[4]的一个应用关联规则挖掘市场购物篮分析,客户细分,店面布局、目录设计和通讯报警预测。
不同的关联规则挖掘算法是先验的算法(AA),分区,动态散列和修剪(设计马力),动态项集计数(DIC)、FP增长(台塑),烤焦,长矛,喝采& Declat MaxEclat。[5]

分类

分类和预测是两种数据分析形式,可以用于提取描述重要数据模型类或预测未来的数据趋势。这是一个过程,学习模型预测类标签从一组训练数据,然后可以用来预测离散类标签新样品。最大化时,预测精度得到分类模型在测试集分类的例子看不见的在训练是分类算法的主要目标之一。数据挖掘分类算法可以按照三种不同的学习方法:semi-supervised学习,监督学习和无监督学习。发现知识的不同分类技术是基于规则的分类器,贝叶斯网络(BN),决策树(DT),最近的邻居(NN),人工神经网络(ANN)、支持向量机(SVM),粗糙集,模糊逻辑、遗传算法。[6]

聚类

在集群中,重点是找到一个分区的数据记录到集群,每个集群内点接近对方。集群组数据实例的子集以这样一种方式,类似的实例是组装在一起,虽然属于不同的群体不同的实例。从聚类的目的是找出一套新的类别,最新的组织自己的兴趣,和他们的评估是内在的。[7]没有先验知识关于数据的数据。不同的聚类方法(HM)分层方法,分区方法(PM), Density-based (DBM)方法,基于模型的聚类方法(MBCM)、基于网格的方法和软计算方法(模糊、基于神经网络),平方偏差集群(矢量量化),网络数据和集群图[8]

回归

回归是学习函数,将一个数据项映射到一个实值预测变量。不同应用程序的回归预测生物质在森林的数量,估计病人生存与否的概率在他的诊断测试,预测消费者对新产品的需求。[9]在这里,模型训练预测持续的目标。回归任务通常作为分类的任务与定量类标签。预测的方法是非线性回归(NLR)和线性回归(LR)。

数据挖掘技术在农业中的应用

神经网络

桑杰D。Sawaitul et al。关注天气信息,并观察和存储。记录的参数用于预测天气。如果有任何一个变化的记录参数,如风速、风向、温度、降水、湿度,那么可以预测即将到来的气候条件使用人工神经网络反向传播技术。信号范围的增加将大面积[10]。
Somvanshi, V.K. et al .,故意使用人工神经网络的建模和预测降雨和框-詹金斯的方法。其他应用水文的人工神经网络预测每日水麻烦和流量预测[11]。

k - means

k . Verheyen et al。,数据挖掘就是发现有意义的模式和趋势的过程将通过大量的数据,使用模式检测技术以及统计和数学技术。数据挖掘技术常用于研究土壤特性。作为一个例子,K-Mean方法用于土壤分类结合基于GPS技术[12]。
Urtubia等葡萄酒发酵问题的预测,可以通过使用k - means执行方法。提前知道,葡萄酒发酵过程能卡住或缓慢可以帮助葡萄酒酿造者正确,确保良好的发酵过程[13]。

模糊集

Jagielska et al。农业相关领域,描述应用程序。如产量预测是一个非常重要的农业问题。任何农民可能有兴趣知道多少产量预期。过去,产量预测是通过考虑农民的经验在特定领域,作物和气候条件。我们已经讨论了关于数据附加信息概率的概率理论,等级的会员在模糊集理论[14]。
Tellaeche等检测在精准农业杂草。本文总结一个自动检测和计算机视觉系统微分喷洒燕麦属不育系,谷类作物有害杂草生长。这样目的设计一个混合决策系统基于贝叶斯分类器和模糊k - means,所需的先验概率的贝叶斯框架提供的模糊k - means [15]。

决策树、贝叶斯分类

Veenadhari, S。气候因素的影响在重大秋收作物和拉比在中央邦博帕尔地区作物生产状态被认为是。这个研究的发现表明决策树分析表明,大豆作物的生产力主要是受相对湿度紧随其后的是气温和降雨的影响。决策树分析表明,水稻作物的生产力主要是倾向于通过降雨比较蒸发和湿度紧随其后。对于小麦,分析表明,生产力主要是受温度相对湿度和降雨量的影响。从贝叶斯分类决策树的结果被证实。规则形成的决策树是有用的识别条件用于高或低作物生产力[16]。
Shalvi D和De Claris N贝叶斯网络是一种强大的工具,广泛应用于农业数据集。农业应用程序的模型基于贝叶斯网络的学习方法。结果表明,贝叶斯网络是可行的和有效的。贝叶斯方法提高水电地质网站描述,即使使用低分辨率电阻率调查[17]。

再邻居

Altannar Chinchulunn等再,分类算法规则可能分为两个阶段:训练部分和检测部分。贝尔梅霍Cabestany敦促协调相关学习算法规则允许更少的信息分用于指导信息集合。不同技术预计将缩减过程再负担算法[18]。
Rajagopalan和美国拉尔许多研究已经进行了数据挖掘技术的应用对农业数据集。再例如,申请过每天模拟降雨和其他天气变量[19]。

支持向量机

年代。Veenadhari等的主要计划,支持向量机(SVM)分类样本分成两个不相交的类别信息。背后的基本计划分类样本信息转化为线性可断开的。支持向量机(SVM)面积单位的一组连接监督学习方法用于分类和回归[20]。
特里帕西,年代等,基于svm DM应用于未来气候预测从第二代耦合的全球气候模型(CGCM2)获得未来降水的预测。然后分析结果评估气候变化对降雨的崩溃在印度。结果表明,支持向量机提供一个有前途的替代传统的人工神经网络统计降尺度,并适当进行气候影响研究[21]。表1显示了数据挖掘方法用于农业

结论

农业是最重要的应用领域特别是在像印度这样的发展中国家。使用农业信息技术可以改变决策的情况,农民可以产生更好的方法。数据挖掘的决策中扮演着关键角色在一些农业领域的相关问题。它讨论了数据挖掘在农业领域的作用和他们的相关工作由几个作者在农业领域的上下文。它还讨论了在不同的数据挖掘应用程序在解决不同的农业问题。本文整合了不同作者的工作在一个地方它有助于研究人员获取信息的当前场景的数据挖掘技术和应用程序上下文农业领域。

表乍一看

表的图标
表1

数据乍一看

图1
图1

引用