ISSN在线(2320 - 9801)打印(2320 - 9798)
Kaushal Chauhan1,Mukta Takalikar2
|
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际期刊的创新在计算机和通信工程的研究
时间序列数据是面向数据,每个数据项是指一个特定的时间点测量通常在连续情况下空间。实时流媒体数据,潜在的大规模、快速的序列数据信息不断到达项目的有序序列。各种研究进行了重点以批处理模式处理和可视化表示每个值几乎相等的可靠性。在许多领域最近的信息比老年人更有用的信息。我们称之为失忆症等传入的数据作为数据分析它包含更大的价值。论文提出了一个新颖的系统监控流失忆的时间序列数据,处理数据流采用滑动窗口和内存管理方法,总结了失忆症的帮助下数据加权移动平均算法。最后阶段包括可视化失忆症和总结数据流的形式动态折线图可视化和生成的报告总结数据快照,最终促进分析师识别不同模式底层流时间序列数据。
关键字 |
数据流,总结,失忆症,时间序列数据,可视化。 |
介绍 |
时间序列数据是极其用于科学、工程和业务。可视化有助于个人解释信息利用人类感知和视觉效果的心理特征。统计图形,尤其是线图表的时间价值对,主要是用于检查个人或小组时间序列[1]。然而,了解大量的时间序列数据的集合仍然艰难。我们倾向于精英大型系统管理作为网站无论个人必须被迫感知大型组时间序列信息在不同层次的细节和参照经常不断变化的组织[2][3]。 |
数据仓库管理托管服务将存储成千上万的物理和虚拟服务器的详细信息。对于每一个系统,参数如主机负载和内存使用经常登录[4]。这些信息也可以为多个年存档。系统管理的员工都应该准备好问题阐述了信息参加个人客户的希望,而维护管理的意识环境的全局状态[5]。 |
相关工作 |
许多无限流算法没有明显的滑动窗口模型中的同行。例如,计算无限流的最大价值是琐碎的,这样做在一个滑动窗口大小为N需要Ω(N)空间;考虑无添加值的序列,其中最大的项目总是过期当窗口往前移动。因此,最根本的问题是,随着新的项目到老项目必须立即删除[6]进行进一步的处理。 |
一般面向数据的时间是与时间有关的数据。在另一种意义上我们可以假定它是生成的数据的时间戳。当然,这个一般描述不是足够一旦用户需要选择或开发人员需要开发适用的可视化方法。实现交际的重要需求和有效的可视化是考虑信息的特点,这在我们的例子中,随着时间的维度显著相关。各种方法已经得到关于制定准时在几个领域的工程,以及人工智能、数据处理、模拟、造型、数据库和更多的[7]。存在许多消息类型提取和事件识别的技术。这些技术使两到三个扫描日志文件生成消息类型和一个通过使用这个信息来确定事件类型[8]。 |
使用正则表达式为每个不同的令牌是这些技术之一。这有一些缺点,如需要完整的知识系统和适合日志文件包含几个不同的事件。作为我们的重点是日志分析这种技术是有用的,因为它很简单,花更少的时间比其他技术[9]。 |
利用传统的数据库应用程序,需要持久数据存储和复杂的查询。通常,信息包含一个对象集合,插入,更新和删除经常出现低于查询。查询执行一次输入,因此答案反映了这个国家的数据库。自从前几年已经观察到应用程序的出现不工作该知识模型和查询模式。相反,数据自然发生在各种各样的序列流值;例子接受传感器数据,网络流量,资金行情、在线拍卖、和事务日志像互联网使用日志和电话记录[10][11]。 |
除了有窗的抽样[14],一个可能的解决方案来计算滑动窗口查询子线性空间中把窗口分成一小部分称为基本windows[12],只存储每个部分的简介和一个时间戳。最古老的基本窗口的时间戳过期时,它的剧情简介,一个全新的窗口添加到前面,和总增量重新计算。这种方法可用于计算流[12]之间的相关性,发现经常出现项目[15],并计算各种骨料[4][16]的一些操作上执行数据流。 |
然而,一些窗口数据可能不是增量可计算的梗概。对称的散列连接和一个类似的对称嵌套循环联接操作可以延长超过两个[19]或滑动窗口通过周期性地对哈希表扫描(或整个windows)和删除过期物品。有趣的权衡中出现大的哈希表是昂贵的维护如果元组执行过期太频繁[20]。时间序列数据可以通过应用各种近似方法,分析[29]中所述的一些集群技术提供更好的方法来分析和处理后这些(数据)流可以通过各种视觉可视化方法代表了时间的数据[30]。适当的可视化方法可以应用的基础上,综述了可视化方法等各个方面类型的变量映射技术,参照不同维度的属性数据流[32][33]。动态和交互式可视化必须在考虑用户很容易访问和分析的目的。时间序列数据流的各种可视化技术存在至今简要描述和总结[34]。 |
数学建模 |
成功: |
总结了时间序列数据流。 |
交互和图形流可视化动态图表的形式。 |
失败: |
错误的时间序列数据流超出阈值水平。 |
图形内存缓冲区溢出 |
动态视觉滞后或反应缓慢。 |
仿真结果 |
本节提供的性能和精度结果时间序列可视化系统。 |
1。显示时间 |
从图1中,我们得出: |
图表显示数据点,显示平均时间是1.2毫秒。 |
随着数据点数量的增加,每个数据点的显示时间稳定,不增加。 |
2。处理时间 |
从表1中的数据,我们得出这样的结论:预处理的时间成正比系列的数量和重量的窗口流数据。处理时间也取决于数量的时间间隔数据分析变量的存在和数量;然而许多层次水平并不影响。 |
性能测试了360000条记录的数据为200 +数据流。 |
3所示。数据点绘制时间 |
结论: |
策划的时间取决于将要绘制的数据点的数量。 |
4所示。摘要准确 |
加权移动平均、指数平滑法用于计算总结趋势。日军(平均绝对百分比误差)是用于检测的准确性。总结的日军%更准确更少。 |
图2显示了比较分析的方法。 |
从上面的图表,可以看出加权移动平均有日军< = 20%,从而提供> = 80%的准确率。 |
时间序列可视化系统采用加权移动平均能够提供80%至98.5%准确的总结。如果总结在地平线上,系统可以预测准确的到达的数据点> = 75%。作者提到,75%准确的结果是可接受的[21]。 |
5。可视化的用户界面开发: |
下面的图表组件开发可视化一个失忆的数据与监测监控视图(图3和4)。 |
结论和未来的工作 |
运行时视图更新能力缺乏许多系统,因为这些系统提供的静态视图图;相比之下我们的系统是动态的,帮助用户在视觉探索。积累功能是新的和在任何其他可视化系统。 |
许多工具存在视觉勘查;但是我们的系统提供了功能总结金融环境将是非常有用的业务分析师的决策。时间序列可视化系统提供最小的显示时间数据并不是预先计算和分层存储。 |
总结的数据流和积累的数据点是使用加权移动平均等趋势,实现方法是预测技术的先决条件。这是默认的算法所使用的系统和用户不能选择要使用的算法。系统可以增强提供设施选择预测算法和比较结果。 |
未来系统的方法将流视觉上各种便携式设备如手机、平板电脑、台式电脑和个人电脑。 |
承认 |
第一作者表达感激他的项目经理迪的利润率为有用的评论,评论和参与通过硕士论文的学习过程的一部分。这项研究是由SAS研发(印度)分公司。 |
引用 |
|