所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

比较监督和非监督学习分类器的旅行建议

Zohreh Bahman Isfahani1 *,Shahram贾法里2和Reza Akbarian3
  1. 伊朗设拉子大学学院学习
  2. 设拉子大学电气和计算机工程学院的伊朗
  3. 伊朗设拉子大学AssociateProfessor
通讯作者:Zohreh Bahman Isfahani,电子邮件:zh_1476@yahoo.com
相关文章Pubmed,谷歌学者

访问更多的相关文章全球研究计算机科学杂志》上

文摘

分类是最常见的一种活动相关领域的智能决策。神经网络是解决数据挖掘问题的合适的方法特别是分类。通常使用神经网络求解分类问题,适当的输出是现有的,监督培训类型被选中。在这项研究中一个比较电子旅游数据分类是由使用两种不同的学习方法,监督和非监督和适当的输出值确定的输入数据。输出包括一些旅游包适合游客推荐根据输入值。实验结果显示,尽管目标输出值存在,神经网络的输出与无监督学习和SOM建筑更精确的预测与监督学习相比,神经网络提出旅游包更多的构象的旅游选择的最终评价结果给出的测试数据集预测表示密切的专家和他们的护理结果获得了非监督学习的评估方法。

关键字

分类、智能旅游推荐系统模型,神经网络、自组织映射、多层前馈,监督学习、无监督学习

介绍

旅游业是世界上最成功的和动态的行业。大多数旅游公司精心制作的网站展示和销售他们的产品。旅游业是信息密集型业务,和信息的数量迅速增加;然而有效的访问这些信息成为一个挑战。近年来,随着许多国家转向旅游经济,有大规模扩大旅游供应商产品。随着越来越多的旅行安排是由在线压力放在e-Tourism网站开发人员提供有效的和易于使用的接口和智能服务[1]。e-tourism信息服务特征数据和不同类型,如旅行社、酒店、旅游路线和景点。面对如此广泛的旅游资源,游客需要花大量的时间在寻找信息。一方面,旅游显然面临着无尽的集团现有的选择,另一方面,异质性的地方参观。此外,游客不愿意花太多的时间在网上搜索。 Therefore, users need an intelligent online assistant. Artificial Neural Network is a system loosely modeled based on the human brain. It has ability to account for any functional dependency. The network discovers (learns, models) the nature of the dependency without needing to be prompted. Initially the application of data mining is not being used because of complex structure, long training time, and poor interoperability. But as neural networks is a powerful technique to solve many real world problems[2]. They have the ability to learn from experience in order to improve their performance and to adapt themselves to changes in the environment. In addition to that they are able to deal with incomplete information or noisy data and can be very effective especially in situations where it is not possible to define the rules or steps that lead to the solution of a problem. Classification is one of the most frequently encountered decision making tasks of human activity. A classification problem occurs when an object needs to be assigned into a predefined group or class based on a number of observed attributes related to that object. Many problems in business, science, industry, and medicine can be treated as classification problems. The aim of this paper is to present the comparison of neural network techniques as data mining methods on data from tourism and also to present a model of intelligent recommender system, considering that in this model a classification problem will be solved with data mining using neural network methods.

人工神经网络(ann)

一个人工神经网络(ANN)是一个信息处理模式,是受生物神经系统的方式,如大脑处理信息。这种模式的关键要素是小说结构的信息处理系统。它是由大量的高度相互关联的处理元素(神经元)一起工作来解决具体问题。人工神经网络,就像人一样,通过例子学习。安一个配置为一个特定的应用,如模式识别或数据分类,通过学习过程[3]。学习在生物系统涉及调整之间存在神经元的突触连接。这是真实的
人工神经网络。有许多不同类型的ANN模型,而不是一个类型。每个表单的安对一组特定的条件有不同的特征,类似于大脑的不同区域的功能特异性[4])。然而,所有的ANN模型中指定的三个基本条件是实体组成:神经元的模型本身,突触连接的模型和结构,训练规则更新连接权值[5]。安由数量的高度连接ANs,这样每一个连接到其他ANs或本身。根据体系结构中,网络大致可以分为前馈神经网络(fnn),复发性神经网络(RNNs),及它们的组合。一些流行的网络拓扑结构包括完全连接的模糊神经网络,RNNs,自我组织图(索姆)和细胞神经网络(cnn)。[6]

自组织映射(索姆)

耶鲁大学管理学院是一个前馈网络无监督学习。[7],它通常包含一个二维单层神经元除了分支节点的输入层,如图1所示。SOM神经细胞有两种不同类型的连接。向前有连接神经元的输入层神经元的输出层,以及横向输出层神经元之间的连接。横向连接是用来创建一个神经元之间的竞争。[8]
图像
无监督人工神经网络训练算法是不同的,因为没有预期的输出。SOM培训是基于竞争学习策略:基于欧氏距离的测量,最好的神经元学习的将其权重不活跃的连接活跃的[8]。换句话说,最大的神经元激活水平在所有输出层神经元成为赢家(winnertakes——所有神经元)。神经元是唯一的神经元,产生一个输出信号。所有其他神经元的活动是抑制竞争。神经元接近获胜者也更新根据社区的关系。这样,索姆有效集群输入向量通过竞争性学习过程,同时保持输入空间的拓扑结构。

多层前馈神经网络

Figure2显示了一个典型的模糊神经网络的体系结构——ANs排列成层,和每一个连接到所有ANs相邻层。没有每一层内的神经元之间的联系。流动的信息之外,每一个需要输入从所有节点前层和单一输出值发送给下一层中的所有节点。最左边的层是由用户提供的输入,从最右边的层和输出是输出最终用来做点有用的事情。受欢迎的模糊神经网络包括多层感知器(mlp)和RBF网络,都是完全连接的分层模糊神经网络。我向MLP年代最流行的基于“增大化现实”技术r angement网络。[8]。
图像
延时通常由三层——一个输入层、隐藏层和输出层。输入神经元的数量通常是决心与输入向量的维数相对应。隐层神经元的数目决定实验和输出向量的维度建模或类的数量分类通常决定了输出神经元的数量。每个神经元都有输入的数量(从外面上一层神经网络或)和输出(导致的后续层或神经网络[8])。神经元计算其输出响应加权和的基础上根据一个激活的所有输入功能。数据流在一个方向上通过这种神经网络从外部输入到第一层,这是通过隐藏层(s),然后传递到输出层的外部输出。

提出了E-tourism推荐模型

这是一个智能旅游指导系统的框架模型,提出e-tourism发展作为推荐系统基于神经网络。在这个建议模型,收集必要的旅游资料不仅由企业和旅游机构,但也通过网站和旅游网站包括以下数据组:第一个数据组相关用户的配置文件可以在公司和旅游机构的文件或从会员获得输出旅游网站和网站用户和存储在一个特殊的数据库。第二个数据组相关的旅行之前的记录获得旅游特殊历史数据库的查询和适用条件。第三组数据包括笔记是收到客户的反馈或通过接触形式或消息面板和旅游协会网站和网站[9]。雷竞技网页版他们也通过问卷调查收集了机构和旅游公司。预处理后这些数据组,输入一个推荐引擎暗示通过数据挖掘算法在神经网络。在这台发动机分类数据组将基于神经网络完成。这台发动机的输出是推荐旅游计划决策旅游宣布通过旅游公司旅游或在一个合适的部门旅游网站介绍他/她推荐的旅行计划。提出的推荐模型如图3所示。
图像

案例研究:

数据收集

数据从旅游机构和公司获得在伊斯法罕城模拟基于神经网络的推荐系统模型。有400条记录过滤从原始数据库。旅游分类,我们需要选择主变量来确定旅游交付和旅行计划,我们选择16属性作为分类变量季节、教育水平、年龄等等分类变量如表1所示。
图像
图像
推荐引擎的设计实验研究根据提出的推荐模型,利用Matlab软件进行。这是一个分类问题,利用两种方法或解决神经网络架构。这个推荐引擎的输出,建议游客旅游包包括旅行
包1号旅游包12号表3所示。
图像

推荐引擎的设计:确定网络架构:

一开始,在数据挖掘和推荐引擎的设计,使用神经网络的自组织方法。使用SOM算法的原因或kohonen神经网络是我们期望神经网络分类的训练数据的规范用户的电子旅游没有主管,意味着没有一个模式和一个样本。对于分类数据,不同的样品给任何样本的网络和组名称指定为输出。任何数据的新样品已收到,训练后的网络可以指定这个样本属于哪个阶级。这个模型的运作趋势是第一次旅游网站的所有用户组是曼联,然后采取行动在集群。这种神经网络技术可以帮助选择集群的数量或在任何群体中选择任何的人。使用SOM建筑集群,因为元素和人进入,他们聚集在一组。经过聚类阶段,分类阶段,一个人的相关信息作为输入,最后它决定谁和什么集团必须选择。在选择特殊群体的人,旅行建议方案介绍他/她并把它放到访问前面生成的网络用于这部分。

Method1。与SOM建筑分类

有16个条目包括统计样本数据与自组织网络,也有一个输出将相同数量的旅行建议包旅游,我们将矩阵400年17。在这个自组织方法,网络拓扑结构包括4集群因为在分类方法与统计样本数据,有12类中数据进行分类这意味着一个向量12在1 0或1的成员。对应的类旅游推荐包。随机生成的自组织方法是中心在设计网络,因此任何条目在同一重量与其他条目。训练后网络,最近的向量集群中心发现和分配。重复的培训行为,集群中心不断更新。只要将记录提供给网络,它是一个时代,我们定义这个网络中重复率为500。分类完成后,我们可以研究分散的输出。以这种方式和重复的操作,所有集群相似附近安排一个另一个。它决定输出相关提到集群数据是通过分类新数据的入口,他们必须被放置。 The output dispersion rate in this cluster is as a suggestion which is proposed to him/her as the user’s suitable traveling package by the system.

方法2。分类与前馈架构

在这种方法中,隐层的神经元的数量从3到15,在任何阶段的测试重复30次。网络最小分类错误,意味着任何数据正确分类和这个网络将被选中。我们训练数据获得12集合。当新数据进入网络,输出将会是一个向量,所以数据属于集团拥有数量最多的输出向量。解决问题的结果分类方法是我们最小的分类错误,因此最好的网络性能8在隐层神经元。表4所示。
图像

结果和讨论

以下数据和结果显示使用SOM建筑旅游样本数据集的分类。结果在图4中,定义5。
图像
Figure6显示分类矩阵的分类数据与多层前馈结构。混淆矩阵给出了结果在训练和测试阶段。实际和预测分类混淆矩阵包含信息的分类系统。这种系统的性能通常是评估使用矩阵中的数据。桌子上有一个行和列的身体为每个可能的分类。行对应于正确的分类和预测分类列对应。
图像
图像
上面的结果是通过研究网络函数的报告在每个方法。在这个过程中75%的数据被用于训练网络,很明显,错误率在验证和测试数据是在更高的水平,因为它是添加外部网络的训练周期。网络的必要性调查与验证数据是阻止训练网络之外的测试数据。验证检查已经停止的经纪人在网络培训。这意味着训练网络的持续,网络使数据和反应也只是提到的数据。

绩效评估

评估的性能建议根据客户的规格,我们设计了一个特殊的问卷收到旅游专家和专业建议游客使用神经网络测试中使用的数据记录。研究这些调查问卷后,我们计算的正确的比例推荐包或使用我们的模型相比,预测精度作为测试数据集包含100条记录的专家建议。以下结果将显示我们与SOM模型架构,更好。在我们的模型中,知识是分布在不同的代理和提高推荐的质量提供了[9]。计算公式的正确分类率模型预测精度公式如下:
图像
模型预测精度计算,减去错误频率从1。的整体精度计算模型在所有三种方法,包括使用SOM神经网络模型架构,使用模糊神经网络体系结构中,一个神经网络模型和人类专家的知识。结果如表7所示。
图像
图像

结论

根据提到的点,使用神经网络方法在本研究数据挖掘旅游制定旅行计划,因此客户在旅游业。通过考虑从样品测试程序获得的结果,可以发现,设计一个基于神经网络的推荐系统模型是一个合适的工具e-tourism发展及其优化。要注意方法的比较结果SOM建筑(非监督)和前馈建筑(监督)表明SOM更准确的提供给客户,在e-tourism决策模型中。其他行动,将来可以根据该模型确定这项研究包括游客的满意度从提供旅游包定义率以及国家利益的影响,功能和反馈的游客在确定输出的方案。

承认

我们感谢信誉旅行社在伊斯法罕城的工作人员和相关机构的援助,他们的建议,帮助我们提高研究和花费时间的游客或实验。

引用

  1. n . Sharda智能视觉旅行e-tourism网站推荐系统模型。黄金海岸,可持续旅游CRC, 2008。
  2. Du, k l和m . n . s .专家神经网络在softcomputing框架中,伦敦,施普林格,2006年。
  3. p·理查德,介绍用神经网络计算。李普曼,IEEE ASSP杂志,1987年。
  4. 贝特·m·d·j .一方面,智能数据分析:介绍、柏林、纽约、施普林格,2007年。
  5. k·l·杜·m·n·s .哲人。神经网络在softcomputing, 2006。
  6. d . Graupe人工神经网络原理,世界科学出版,新泽西,伦敦,2007年。[7]t Kohonen、自组织映射、柏林、纽约、施普林格,2001年。
  7. J .Yang,使用人工神经网络智能数据挖掘,华威大学,博士论文。,2010年。
  8. 里奇,f, Werthner, H。,"Case-Based Querying for Travel Planning Recommendation", Information Technology and Tourism, Vol. 4, No. 3, 2002.
    全球技术峰会