在线刊号(2320-9801)印刷刊号(2320-9798)
基于数据挖掘的活动检测研究综述
今天,各种应用程序都需要能够监视连续的细粒度数据流,以便发生某些高级活动。许多计算机化系统——包括ATM网络、web服务器和入侵检测系统——系统地跟踪我们执行的每个原子操作,从而生成大量时间篡改的观察数据流,可能来自多个并发活动。在本文中,我们解决了从这种交错的数据流中有效检测高级活动发生的问题。这一重要问题的解决方案将极大地有益于广泛的应用,包括欺诈检测、视频监控和网络安全。我们定义了在tMAGIC索引中插入和批量插入的算法,并证明了这可以有效地完成。我们还定义了解决两个问题的算法:“证据”问题,试图在给定的观察序列中找到一个活动的所有出现(概率超过阈值),以及“识别”问题,试图找到与观察序列最匹配的活动。我们引入了复杂性降低限制和修剪策略,使问题(本质上是指数级的)与观测数量成线性。我们的实验证实,tMAGIC的时间和空间复杂度与输入的大小成线性关系,并且可以有效地检索被监控的活动实例。
Santosh S. gurav, S. R. Todmal教授