所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

一项研究论文检测垃圾邮件僵尸

Jiten Shah Satish辛格Vikram辛格教授Vijaya Sagvekar
学生会员(Comp) Atharva工程学院,印度孟买
助理教授(Comp) Atharva工程学院,印度孟买
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

在本文中,我们的目标是检测所涉及的被感染的计算机网络中垃圾邮件活动,广泛被称为垃圾邮件僵尸。鉴于垃圾邮件为攻击者提供了一个关键的经济激励来招募大量的破坏机器,我们开发一个垃圾邮件僵尸探测系统命名点网络中传出消息的跟踪。点是设计基于强大的统计工具,称为序贯概率比检验(SPRT),具有有界的假阳性和假阴性的错误率。

关键字

垃圾邮件的僵尸,损害机器

介绍

现在电子邮件垃圾邮件问题变得越来越严重的问题。垃圾邮件不仅会导致时间和计算资源的滥用,从而导致经济损失,但它也常常用来宣传非法商品和服务或促进网上欺诈行为。最受欢迎的反垃圾邮件检测垃圾邮件过滤方法。一个垃圾邮件过滤器是一个程序,用于检测主动和不需要的电子邮件和防止这些消息用户的收件箱。垃圾邮件检测的主要挑战在于,垃圾邮件发送者总会找到新的方法来攻击一些发送垃圾邮件的垃圾邮件过滤器由于经济效益。垃圾邮件发送者没有选择但是发送大量的相同或相似的垃圾邮件的电子邮件存储大小抽象应该小。同时获利。
互联网正在以非常快的速度和增加其网站每30天,使用互联网的人数正在增长。因此,全球通信在日常生活中发挥着重要的作用。与此同时,计算机犯罪也增加。开发对策来检测或阻止攻击,这些措施大部分是根据已知事实,已知的攻击模式。
这些类型的垃圾邮件在互联网通常存储在机器人的形式,它是由这个词被称为僵尸网络。僵尸网络控制器利用等技术处理和管理这些机器人的IRC频道。僵尸网络控制管汇错的用途:增长的DDoS攻击,窃取密码的每个用户和个性,创造蜱虫欺诈[1],垃圾邮件基础[2]。这种技术源破坏垃圾邮件,垃圾邮件是总结请到电子邮件消息包括最早的公共关系。

相关工作

现有方法主要取决于两个方面一个是有效的垃圾邮件检测即将离任的邮件网络/系统。一般的僵尸网络攻击显示出一些共同特征。这些研究提供了重要的见解总全球垃圾邮件的特征聚类垃圾短信收到了僵尸网络的供应商到垃圾邮件活动中使用嵌入式url和near-duplicate内容聚类,分别[3]。僵尸网络攻击的常用方法有很大的不同,他们不考虑治疗从一个网络他们只考虑整个网络。他们试图只在检测垃圾邮件活动只有在接收端。然而,他们的方法更适合大型电子邮件服务提供商了解全球总体特征。在本文中,我们主要集中做一个管理工具,用于检测受损机器在网络位置是一个轻量级的垃圾邮件僵尸检测系统;它不需要支持的网络入侵检测系统根据Bot猎人[4]作为一个简单而强大的统计方法,序贯概率比检验(SPRT)[5]已成功应用于许多领域。在网络安全领域,SPRT用来检测端口扫描活动基于代理的垃圾邮件活动和MAC协议在无线网络不良行为。
问题公式化处理培训机器的网络基于非监督机器学习的情节之间的不同集群邮件是否僵尸垃圾邮件,这里的序贯概率测试起着至关重要的作用在僵尸垃圾邮件分类测试数据或不,然后训练系统清楚地识别僵尸垃圾[6]。这里有一组训练数据和电子邮件被发现使用序贯概率测试成功地分类在本节中,我们制定垃圾邮件的僵尸网络的检测问题。特别是,我们讨论网络模型和假设的检测问题。让网络这个网络的逻辑视图,由电脑数量可能会受到损害。我们假设消息将起源于这个网络。每个即将离任的消息是通过现场检测系统。

SPRT

在本节中,我们提供必要的背景在序贯概率比检验(SPRT)理解提出垃圾僵尸检测系统。有兴趣的读者是指向[7]SPRT详细讨论的话题。在最简单的形式中,SPRT是测试一个简单的零假设的统计方法对一个备择假设。直观地说,SPRT可以被看作是一个一维随机漫步和两个指定的边界对应两个假设。有关随机变量的样本按顺序到达,走一步向上或向下移动,根据观察到的样本的价值。当走到或跨越的边界第一次走终止和相应的假设被选中。从本质上讲,SPRT是传统的概率比测试测试的一种变体在什么分布(或与分布参数),它更可能是观察到的样本。但是,与传统的概率比测试需要一种预定义的观察,SPRT作品以在线方式和更新样品按顺序到达。一旦获得了足够的证据来画一个结论,SPRT终止。作为一个简单而强大的统计工具,SPRT具有许多引人注目的和理想的特性,导致广泛传播技术在许多领域的应用[8]。 First, both the actual false positive and false negative probabilities of SPRT can be bounded by the user-specified error rates. This means that users of SPRT can pre-specify the desired error rates. A smaller error rate tends to require a larger number of observations before SPRT terminates. Thus users can balance the performance (in terms of false positive and false negative rates) and cost (in terms of number of required observations) of an SPRT test. Second, it has been proved that SPRT minimizes the average number of the required observations for reaching a decision for a given error rate, among all sequential and non-sequential statistical tests. This means that SPRT can quickly reach a conclusion to reduce the cost of the corresponding experiment, without incurring a higher error rate. In the following we present the formal definition and a number of important properties of SPRT. The detailed derivations of the properties can be found in [7].

点检测算法

点是设计基于统计工具SPRT我们一节中讨论的。在检测垃圾邮件僵尸现货,我们认为H1作为检测和H0常态。即H1是正确的,如果担心机器损坏,和H0是真的如果不是妥协。此外,我们让ξ= 1如果第i个消息从有关机器的网络是一个垃圾邮件,否则和ξ= 0。SPRT需要四个来自用户的可配置参数,即所需的假阳性概率α,所需的假阴性概率β,消息是垃圾邮件的概率H1是真的(θ1)和消息是垃圾邮件的概率H0是真的(θ0)。我们讨论用户如何配置四个参数的值后,我们提出算法。根据用户指定的α和β的值,这些值SPRT A和B两个边界的计算。

提出系统的工作模型

架构和工作提出了系统后,帮助训练机通过收集数据。系统有一个位置检测电路这有助于分类邮件的僵尸不信这是一个机器学习环境是无监督each即将离任的邮件的邮件服务器部署工具是被抓获each邮件被垃圾邮件检测系统.spam交叉检查结果被记录在一个数据库的使用培训邮件服务器,然后邮件计数的统计机器正在检索发现垃圾邮件的数量的计数实际上出现在即将离任的电子邮件的数量,然后计算值执行,帮助分析阈值,训练系统的帮助下SPRT和现场检测比较了电子邮件和阈值的训练价值系统来预测它作为垃圾邮件僵尸。进行比较和机器被破坏的学习过程。
图像

结论

垃圾邮件僵尸成为最重要的网络安全问题,如今,它不断增长的白天非常迅速。的检测垃圾短信也是主要的电子邮件沟通的重要检测垃圾邮件僵尸,它成为重要的分类消息为垃圾邮件和非垃圾消息为了执行这个我们开发了一个系统网络中检测受损机器命名通过监测输出消息。现货是基于一个简单的设计和强大的统计工具叫序贯概率比检验检测受损机器参与垃圾邮件活动。现货有界的假阳性和假阴性的错误率。它还要求观察检测垃圾邮件的数量降至最低,僵尸。

数据乍一看

图1 图2
图1 图2

引用


  1. 拉马钱德兰,。,and Feamster, N,” Understanding the network-level behavior of spammers”,[ In SIGCOMM'06, 2006.

  2. m·谢·h·阴,h·王。一个有效的防御电子邮件垃圾邮件洗钱。在计算机和CommunicationsSecurity ACM会议,亚历山大,弗吉尼亚州,2006年10月。2

  3. g .古·波勒斯诉Yegneswaran, m .方和w·李。通过ids-driven对话框相关Bothunter:检测恶意软件感染。InProc。第16届USENIX安全研讨会,波士顿,MA, 2007年8月。2

  4. y谢,徐,k .亚干r . Panigrahy g . Hulten, i Osipkov。垃圾邮件僵尸网络:签名和特征。Proc。ACMSIGCOMM、西雅图、佤邦,8月2008.1,2

  5. s . Radosavac j·s·巴拉,i Koutsopoulos。一个框架,用于mac协议在无线网络行为检测。在第四届ACM车间无线安全,科隆,德国,2005年9月。2

  6. 瓦尔德。顺序分析。约翰•威利& Sons . n:行情),1947年。

  7. g·b·威瑟雷尔和k·d·Glazebrook。inStatistics顺序的方法。