石头:2229 - 371 x
B.Sujatha* 1,博士。Chenthur Pandian2
|
通讯作者:B.Sujatha,电子邮件:sujab15@yahoo.co.in |
相关文章Pubmed,谷歌学者 |
访问更多的相关文章全球研究计算机科学杂志》上
对周期模式挖掘的研究达到一个伟大的关注现在。它是把时间规律性的问题。有许多新兴的应用周期模式挖掘,包括天气预测,计算机网络和生物数据。模式与周期性的发现具有重要意义,近年来得到迅速发展。发现问题的时间为时间序列数据库,称为周期性检测。这些类型的周期的研究可用,如周期性象征,序列周期性和段周期性确定即使在时间序列数据库中噪声的存在。使用修剪策略其中一些模式识别和提取给定时间序列数据库。有不同的技术已经存在周期模式挖掘。这些现有技术都有自己的优缺点。本文调查的一些现有的周期模式挖掘技术。
关键字 |
周期模式挖掘、时序规律、符号周期序列的周期性,周期。 |
介绍 |
提供数据的时间序列数据库是一个随着时间的发展。时间序列数据的几个例子是气象数据,棚屋市场数据、能耗数据和计算机网络数据。数据挖掘就是发现的过程模式和趋势使用技术从大量的数据,使用数学和统计的概念。 |
时间序列数据挖掘的研究集中于发现不同类型的模式。周期性矿业技术需要用户指定一个周期长度决定的速率时间序列周期的。这些技术假定用户知道时期之前的长度或者他们愿意尝试不同的周期长度值,直到所需的周期模式出现。采矿过程必须重复执行取得好结果。 |
解决这些问题的方法是找到发现潜在的时间序列数据,其次是任何现有的应用模式挖掘技术提取有趣的模式。发现问题的时间为时间序列数据库,称为周期性检测。这些类型的周期的研究可用,如周期性象征,序列周期性和段周期性确定即使在时间序列数据库中噪声的存在。有不同的技术用于周期性检测。他们有自己的优缺点。本文提供了一些讨论的一些技术用于周期性矿业。 |
文献调查 |
本节讨论一些可用的周期模式挖掘技术。 |
高效的周期性挖掘时间序列数据库中使用后缀树提出了在"拉希德et al ., [1]。时间序列数据库是数据值的集合存储在均匀间隔的时间来显示一个实体的行为。周期性检测方法检测时间规律在时间序列和分析这个数据库的目的是找到是否以及如何频繁的重复周期模式内的系列。在这里,要分析的数据大多是嘈杂的,不同类型的周期性。基于作者STNR用作suffix-tree周期性检测算法在时间序列数据。这个算法是noise-resilient和运行在O (kn2)在最坏的情况下。这种方法还发现象征,序列和段时间序列的周期性。 |
锦陈[2]提供了一个上下按钮有向无环图序列模式挖掘方法。序列模式挖掘是数据挖掘的一个重要问题,检测频繁子序列在序列数据库中。作者提出了一个UDDAG模式快速增长。小说是一种新的数据结构,支持双向增长模式从两端的检测模式。UDDAG,在我递归级别,我们可以种植模式的长度最多2张。因此,length-k模式可以在[log2 k + 1]发现水平的递归在最好的情况下,将导致更少的水平的递归和更快的增长模式。 |
Jae-Gil李et al。[3]提出了采矿技术区别的模式分类轨迹道路网络。基于特征分类是数据挖掘领域的使用。使用这种方法,特征提取的数据点,点转化为特征向量。每个向量代表的存在特征对应的数据点。对于有效的分类,我们需要发现区别的特征。这种方法使用频繁模式分类。知道频繁模式的有效性,首先在分类分析道路网络的行为轨迹数据。通过分析,他们发现意味着什么,除了车辆的位置,这些位置的顺序是很重要的一个提高分类精度。基于作者的分析,他保证频繁序列模式是与先前的方法只使用个人良好的压缩特性的候选人因为他们保持这个订单信息。这种模式也提高了分类精度的10 - 15%。 |
Avrilia Floratou等。[4]给出一个技术高效、准确发现序列模式的数据集。顺序数据挖掘应用程序的主要目的是发现频繁发生的模式。这种频繁模式背后的挑战是使一些噪音在匹配过程。最主要的是一个模式的定义以及两种模式之间相似度的定义。这个定义的相似度可以改变从一个应用程序到另一个地方。作者提出了一种新的算法被称为火焰(灵活和准确的主题探测器)是一个灵活的基于后缀树的算法,可以用来发现频繁模式与各种主题(模式)模型的定义。火焰是准确的,快速和可伸缩的。 |
大卫·罗et al。[5]提供了迭代发电机和代表规则挖掘软件的规范。最好如果软件开发与清晰、准确和记录规范。但是软件产品往往较差,不完整的,甚至没有任何记录规范。这些因素导致了软件维护成本高。这主要是由于努力理解或理解软件代码库。改善项目的理解,作者介绍了迭代中发生频繁模式挖掘,输出模式程序跟踪。频繁的程序行为反过来代表软件规范。所以,作者介绍了矿山关闭迭代模式(ie)最大模式没有任何superpattern拥有相同的支持。可以与这些发电机封闭模式产生的一组规则称为代表规则向前,向后中间事件之间的时间条件在一个将军表示。 |
Obules u et al .,[6]表明修剪策略,删除冗余数据在时空数据库中。时空数据的运动服从周期模式。(ie)的对象遵循相同的路线在固定的时间间隔。作者提出了模式匹配技术来发现时间序列数据库中重复的模式。三种模式,如符号、序列和段周期性也发现。使用修剪策略冗余数据推导出以减少内存使用量和复杂性。 |
基于后缀树的噪音减震算法周期性检测时间序列数据库中提出的"拉希德et al ., [7]。他们提出一个噪音减震算法使用后缀树作为一种基础的数据结构。该算法不仅计算符号和周期性,而且检测部分在时间序列周期性。它还有效地检测周期性与现有的算法相比,噪声的存在。它检测到周期性的更换,插入,删除或任何这种类型的噪音。作者提高他们以前的算法通过合并宽容的时间窗口使其更沉默的插入和删除噪音。 |
大卫•罗等。[8]提出了一种新颖的方法,框架和工具对矿业inter-object基于场景的规范的形式UML2-compliant变体Harel达姆和生活的序列图(LSC)。LSC作为规范语言扩展了偏序序列图的语义与颞活性和符号类级别生命线生成紧凑的规范。该算法的输出满足给定阈值的支持和信心,挖掘从输入程序执行竞赛。作者用搜索剪枝策略,特别适应lsc,它提供了高效的采矿任意大小的场景。 |
生活序列图表(LSC),一个视觉模型,基于场景,inter-object提出语言是大卫•罗等。[9]调查的问题挖掘基于场景的触发器和影响程序执行路径。作者使用数据挖掘方法提供重要的和完整的模用户定义的阈值的结果。输入触发和效果场景和由此产生的候选模式场景表示和可视化使用UML2-complaint LSC的变体。 |
结论 |
周期性的检测是一个发现的过程时间规律在时间序列和分析时间序列数据库的目的是找到如何频繁的时间间隔内重复周期模式。三种类型的周期模式可以发现在时间序列数据库中使用不同的技术。使用修剪策略,我们可以减少冗余数据,减少内存空间和复杂性。这些序列可以用在任何领域根据用户的需要,特别是在地震预测,天气预报,功耗和欺诈检测应用程序。它也适用于生物和DNA序列的区域。 |
引用 |
|