ISSN: 2319 - 9873
法蒂玛真纳女性大学软件工程系巴基斯坦拉瓦尔品第
收到的日期:21/11/2017;接受日期:08/01/2018;发布日期:30/01/2018
访问更多的相关文章研究和评论:工程和技术雷竞技苹果下载杂志》上
数据挖掘技术被广泛用于检测欺诈行为,因为这些技术是最有效的。本文提出一个全面的调查各种论文不同的数据挖掘技术可用于检测欺诈行为。基于定义的标准评估,我们所做的分析,对比技术和评估每个方法的基础上性能,效率和精度。本文评估强和弱的技术和吸引最后的结论。
挖掘技术、信用卡、隐马尔科夫模型
欺诈行为可以被定义为非法或犯罪目的欺骗导致财务或个人利益或损害另一个人而不一定导致直接的法律后果。有两种方法来避免欺诈行为和损失,一个是欺诈预防和其他欺诈检测系统。欺诈防范是禁用的主动机制的发生欺诈行为。欺诈检测系统是骗子时使用超过欺诈防范系统和启动一个欺诈性交易。
作为全球信用卡用户数量的增加,攻击者窃取信用卡信息的机会,其他信息,随后,造假也增加。如果信用卡持卡人没有意识到失去卡,它可以导致信用卡公司巨大的经济损失。大多数时候,持卡人不知道某人他的名片信息的披肩。检测这种类型的欺诈行为的唯一方法是分析在每个卡的模式,并指出任何不一致w.r。通常的模式。许多技术用于检测信用卡诈骗,如决策树、人工神经网络、聚类,等。介绍了各种信用卡欺诈检测论文的调查和评估在不同的参数,论文的其余部分:第二部分详细显示了现有的实现技术。在第三节,吸引了文献综述的结论。在第四部分,综合分析的技术。
增加电子商务应用程序导致的增加使用在线和离线付款的信用卡。信用卡欺诈可以被定义为任何系统或非法使用,犯罪活动通过使用物理卡或卡信息没有持卡人的知识。最常见的技术,用于欺诈检测资讯,离群值,决策树、人工神经网络、集群、新方法和贝叶斯方法。本文讨论了其他相关的论文的摘要信用卡欺诈检测。
论述了信用卡诈骗是一起成长的新技术的发展。它也可以表示,经济欺诈极增加全球通信改进。的损失每年这一欺诈行为被记录,在数十亿美元。这些欺诈行为可以进行非常巧妙,它可以类似于真正的横断面。需要一个有效的方法来检测欺诈,成为所有银行需要为了减少混乱和带来秩序。许多技术分类、决策树、机器学习序列比对、模糊逻辑等用于检测信用卡欺诈交易。以及这些技术资讯和离群值也被用来优化欺诈检测问题的最佳解决方案。这些技术被证明是假警报率降到最低,提高欺诈检测率。两种方法被用来在银行检测和防止欺诈交易1]。
本文包括诈骗犯动机和知识库的信息变成一个自适应欺诈检测系统。本文对抗的学习方法的使用是为了模型的最佳策略,并分类未来的欺诈性交易。使用GMM确定最佳策略是一种有效的方法找到最优的新事务的敌人可能会复制。和使用击打产生综合事务的最佳策略。这两个贡献提供工具能够模仿对手的学习和给信用卡公司预先应对变化的事务策略的能力(2]。
增加电子商务应用程序导致的增加使用在线和离线付款的信用卡。信用卡欺诈也越来越多这些电子商务应用程序。数据流分析是一个基于时间的处理和用于实现接近实时的决策通过检查,比较和分析数据,即使它是涌向来自各种不同来源的应用程序和数据库。流分析技术用于检测和防止信用卡欺诈。我们的技术是用来分析历史交易数据模型的系统可以检测欺诈模式然后这个模型用于分析实时事务。这种技术的优点是它可以减少误警率(3]。
摘要提出了一种信用卡欺诈检测的信号处理技术。这种技术建立了信号处理和模式识别问题之间的关系在检测欺诈和真正的交易比率非常低的问题。使用分数的融合,提出了解决方案,可能会比统计。经典检测问题分析了接收操作特征曲线映射到现实世界中基于关键绩效指标的业务需求。强大的实际问题,结合代理和真实数据与标准方法(包括该方法的比较4]。
提出了在线信用卡欺诈检测与大数据技术框架,通过它可以实现三个主要目的1。能力结合多种检测方法提高精度2。处理大量数据的能力3。,也能实时检测。提出了一种工作流的新框架,它由4层a分布式存储层b .批量训练层c键-值共享层d和流检测层。通过使用这些四层我们能够支持大规模的交易数据存储、实时在线欺诈检测,快速模型数据共享等。这个框架也可以用于其他欺诈检测,如电信欺诈检测,互联网广告欺诈检测等等(5]。
与日益增长的电子商务技术的信用卡信用卡欺诈也增加。从信用卡欺诈预防比检测。所以现有的系统防止信用卡欺诈通过识别欺诈在信用卡的应用。本文提出了一种新的算法与现有算法由于现有系统的局限性。现有系统的局限性是:时间约束、可伸缩性问题和极端不平衡类。克服这些局限性混合支持向量机(HSVM)以及公共和峰值检测信用卡欺诈检测中的应用。HSVM主要是用于模式识别和分类6]。
今天的银行业是非常重要的几乎每一个人都应对身体或网上银行。在本文中不同类型的欺诈保险欺诈、会计欺诈、信用卡欺诈等讨论。检测欺诈活动是非常重要的。本文可通过不同的发现欺诈活动数据挖掘集群技术、人工神经网络、关联、预测、分类分析客户数据以识别可能导致欺诈行为的模式。实时欺诈检测节省巨大的损失和客户的银行从金融损失7]。
随着互联网技术的增加支付通过信用卡也会增加。这进化提高效率和可移植性,但这种付款方式有些短。这使商人无法验证是否真正持卡人客户作出购买与否。这使它容易对欺诈交易秘密。检测欺诈活动不同的技术、模式和算法。提出了许多系统,但系统出现在本文特别关注商人的行业,这将有利于商人通过减少商人的损失(8]。
本文提出了信用卡欺诈检测;计算情报常用的,起着至关重要的作用。本文分析和比较了各种技术通常用于检测信用卡欺诈检测。它只侧重于测量用于访问这些技术的分类性能和等级9]。
这些技术应用于数据挖掘UCSD-FICO比赛2009数据集。从这个实验分析欺诈检测成功率低于50%,树分类器的性能比其他组的分类器。整体成功率评估分类器的性能。
本文提出了一种新颖的基于对信用卡欺诈检测是在三个阶段完成。在第一阶段初始用户身份验证和验证的信用卡。如果检查成功了,那么横断传递给下一个阶段。在第二阶段模糊聚类算法应用在正常使用模式基于他们的信用卡用户找到以前的活动。根据可疑活动的程度上偏离正常的模式是在此基础上计算事务分类,它是鸟嘌呤或欺诈。如果事务是可疑应用神经网络建立学习机制是否实际欺诈或临时偏差由鸟嘌呤的用户。与学习,结合集群检测欺诈活动和最小化假警报变得更加有效10]。
本文提出了一个案例研究,包括多层感知器人工神经网络和聚类分析应用于信用卡欺诈的预防。定性数据的归一化聚类分析成功使用。使用自动延时训练规范化数据提出了不错的效果。早期结果,从聚类分析获得和安在欺诈检测显示可以减少神经元的输入聚类属性。本文的主要目的是呈现早期从安和聚类分析结果11]。
欺诈检测是特别具有挑战性的问题,因为漂移和类不平衡的概念。本文描述了一个精确的欺诈检测设置,也表明,调查员的反应和标签处理明显延迟。提出了两种欺诈检测系统的基础上,一个合奏和滑动窗口方法,本文也表明中标策略由两个单独的分类器在训练,然后聚合结果。现实世界交易的一个大型数据集用于实验,结果表明,该预警精度,这是调查人员的主要关心的,这种方法可以显著提高(12]。
提出了一种技术来检测信用卡欺诈。摘要不同的技术如遗传算法,以行为为基础的技术和隐马尔可夫模型用于解决这个问题。本文的主要目的是检测和准确的虚假欺诈检测。信用卡诈骗是安全的反对。这三种技术可以应用在每个事务。隐马尔可夫模型维护以前的事务日志。以行为为基础的方法创建集群或组的数据。遗传算法用于计算阈值(13]。
本文提出的组合技术,用于检测欺诈行为。第一次购物行为是基于哪种类型的客户购买的产品。其次支出行为检测基于最大的支出。第三个是隐马尔可夫模型中,用户概要文件维护和特定用户的统计信息和统计不同的欺诈场景集群。遗传算法用于计算阈值。最后被求和平均结果。本文的主要目的是探索不同的看法相同的问题和比较这三种技术的效率和性能14]。
信用卡欺诈不仅影响普通百姓,也让他们失去了大量的钱。摘要不同的数据挖掘决策树技术,多层感知器,切比雪夫函数链接人工神经网络(CFLANN)比较的分类精度和运行时间为信用卡欺诈检测。结果表明,在两种数据集延时超过CFLANN和决策树在欺诈检测。尽管在信用卡欺诈预测CFLANN表现好于MLP但在信用卡欺诈检测延时略胜过CFLANN [15]。
欺诈是未经授权的活动发生在自动支付系统,但这些被视为非法活动。许多技术可用于检测欺诈行为在信用卡交易。本文使用集群技术。有不同的聚类方法和单链接法一样,完整的链接组平均法等方法。数据是随机生成的,信用卡和k - means聚类用于检测事务是否欺诈或真正的。集群形成检测欺诈在信用卡事务很低,高,风险,风险高。信用卡欺诈检测的k - means算法是有效的。有效和准确的检测欺诈行为至关重要的是,真实的数据应该是可用的16]。
欺诈在金融部门增加随着新技术的发展将导致全世界每年数十亿美元的损失。欺诈检测系统已成为必要的所有信用卡发行银行减少他们的损失。最常用的技术来检测欺诈行为是贝叶斯网络、决策树、规则归纳方法、支持向量机、人工神经网络,然而算法,隐马尔科夫模型,人工免疫系统,模糊神经网络、模糊达尔文系统和遗传算法。这些技术可以单独使用或元学习技术来构建分类器。提出一项调查的九个不同的技术用于检测信用卡欺诈和评估每个方法基于准确性、速度和成本(18]。
与真正的交易欺诈活动是分散和简单的模式匹配技术检测那些骗子是不够精确。许多不同的技术用于解决这个问题像人工智能、遗传算法、模糊逻辑,机器学习等等,所有这些理解研究技术肯定会导致一个有效的信用卡欺诈检测系统。摘要调查不同的技术用于检测机制和评估每个技术基于某些设计标准(19]。
本文作者信用卡事务处理模型中的操作序列使用隐马尔科夫模型(HMM)和显示它可以用于检测欺诈行为。嗯是最初训练与持卡人的正常行为。如果传入的信用卡交易不接受训练嗯有足够高概率,它被认为是欺诈。与此同时,作者试图确保真正的交易不拒绝。本文作者提出详细的实验结果表明了该方法的有效性和比较它与其他文献中提供的技术20.]。
本文作者进行了一个银行的信用卡欺诈检测问题,并试图改善当前解决方案的性能。这样作者没有采取正确的典型目标最大化的数量分类交易但作者定义了一个新的目标函数误分类成本是可变的,因此,正确分类的一些事务比正确更重要分类。作者做了一个应用程序是一种新型的遗传算法的相关文献的应用领域和交叉算子使用。的算法应用到现实生活中数据储蓄获得几乎是当前实践的三倍。通过使用这个算法性能的现有解决方案提高了200% (21]。
最流行的付款方式是信用卡,但是信用卡欺诈行为在最近几年越来越猖獗。本文模型的操作序列的信用卡使用在意神经网络事务处理。接受者操作特征(ROC)分析技术也介绍了确保欺诈检测的准确性和有效性。神经网络技术是最初训练与合成数据。如果训练神经网络模型(NNM)不接受任何信用卡交易足够低的信心,它被认为是欺诈。本文展示了神经网络算法,信心可以合并成功实现价值和ROC信用卡欺诈检测(22]。
通过使用信用卡欺诈交易的风险就会增加。在现有的信用卡欺诈检测业务处理系统中,欺诈交易后将检测到交易完成,因此很难发现欺诈和关于失去将被禁止发行当局。隐马尔可夫模型是工程和科学家的统计工具来解决各种问题。本文表明,如何检测到信用卡欺诈交易期间使用隐马尔科夫模型。嗯有助于获得高欺诈保险加上较低的误警率(23]。
在本文中五种不同的分类方法可以比较的数据挖掘。比较参数调整为每个方法通过综合搜索,或通过遗传算法。这些分类可以比较在两种培训模式:成本敏感的训练模式,不同的假阳性和假阴性的成本被认为是在训练阶段,另一个是普通的训练模式。成本敏感培训大大提高所有远离朴素贝叶斯分类方法的性能和独立的培训模式。决策树和人工免疫系统和优化参数是最好的方法,我们的实验24]。
信用卡诈骗活动在最近几年已经变得越来越普遍。本研究调查的效率将分类方法应用于信用卡欺诈检测问题。三种不同的分类方法,即。、决策树、神经网络和逻辑回归测试的适用性在欺诈检测。本文提供了一个有用的框架选择最好的模型识别信用卡欺诈风险(25]。
表1显示了信用卡欺诈检测的评估标准使用数据挖掘技术。表2显示了分析的结果评价参数中定义的评价标准。我们学习了25技术和七参数用于他们的评价。分析表2揭示了测试技术用于不同的研究论文。看到的是,所有研究人员使用不同的技术在他们的研究论文。分析表明,在只有少数技术Mareeswari V, et al .性能是在欺诈检测但不好或有效的讨论。性能是资源的低利用率和较低的系统响应时间。这个参数没有讨论一些技术。本文讨论的技术,几乎所有像Malini N,等人讨论他们的技术的正确性。正确性定义为技术是根据规范工作。
表1。评估标准测试信用卡使用数据挖掘技术检测。
参数 | 意义 | 可能的值 |
---|---|---|
性能 | 资源的低利用率,降低响应时间和故障的平均时间和恢复定义技术的性能。 | 是的,没有 |
正确性 | 技术是根据规范工作。 | 是的,没有 |
可靠性 | 技术工作或不是到时间线。 | 是的,没有 |
易用性 | 技术是容易学习和使用的用户。 | 是的,没有 |
安全 | 该技术能够检测并纠正错误 | 是的,没有 |
兼容性 | 技术可以结合其他技术。 | 是的,没有 |
工具支持 | 工具可用于该模型。 | 数据挖掘技术 |
表2。分析参数的测试信用卡使用数据挖掘技术检测。
老不 | 技术 | 性能 | 正确性 | 可靠性 | 安全 | 易用性 | 兼容性 | 工具支持 |
---|---|---|---|---|---|---|---|---|
1。 | MaliniN, et al。 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 然而,和异常值检测 |
2。 | Zeager MF, et al。 | 没有 | 没有 | 是的 | 是的 | 是的 | 是的 | 敌对的学习 |
3所示。 | Rajeshwari U, et al。 | 是的 | 没有 | 没有 | 是的 | 没有 | 是的 | 流分析 |
4所示。 | 萨拉查,等。 | 是的 | 没有 | 是的 | 没有 | 是的 | 是的 | 信号处理 |
5。 | 戴Y, et al。 | 是的 | 是的 | 没有 | 是的 | 没有 | 没有 | 混合框架 |
6。 | Mareeswari V等 | 没有 | 没有 | 没有 | 是的 | 没有 | 没有 | HSVM |
7所示。 | 约翰SN et al。 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 集群、人工神经网络 |
8。 | 斯利瓦斯塔瓦,等。 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 神经网络 |
9。 | 马哈茂德女士,et al。 | 是的 | 是的 | 是的 | 没有 | 是的 | 是的 | 决策树、朴素贝叶斯、事例、支持向量机、神经网络 |
10。 | BeheraTK, et al。 | 没有 | 是的 | 是的 | 是的 | 是的 | 是的 | 模糊聚类和神经网络 |
11。 | Carneiro EM, et al。 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 聚类分析和人工神经网络 |
12。 | 木豆Pozzolo,等。 | 是的 | 没有 | 是的 | 是的 | 没有 | 没有 | 模糊聚类和神经网络 |
13。 | Agrawal,等。 | 是的 | 没有 | 是的 | 没有 | 是的 | 是的 | 遗传算法,基于行为的,嗯 |
14。 | Kumar年代,et al。 | 是的 | 是的 | 没有 | 是的 | 没有 | 没有 | 隐马尔科夫模型,遗传算法 |
15。 | Mishra可,et al。 | 没有 | 是的 | 没有 | 是的 | 没有 | 是的 | 人工神经网络、多层感知器和决策树 |
16。 | 利V et al。 | 是的 | 是的 | 是的 | 没有 | 没有 | 是的 | 聚类 |
17所示。 | Gayathri R, et al。 | 是的 | 是的 | 是的 | 是的 | 是的 | 没有 | 决策树、朴素贝叶斯、事例、支持向量机、神经网络 |
18岁。 | Zareapoor M,等。 | 是的 | 是的 | 是的 | 没有 | 是的 | 是的 | 规则归纳方法, |
趋势在所有的技术研究是正确性和可测试性。所有的技术用于欺诈检测方法是可测试的;拟议的技术测试,给准确的结果。所有技术都是按照规范工作。
Malini N,等人用事例和孤立点检测的技术。基于事例的方法合法和欺诈的例子都是美联储为了训练数据集。该方法可以适合检测欺诈与内存的限制。而异常检测机制使用更少的内存和计算需求。离群值方法快速工作尤其是在线大型数据集。这些技术优化欺诈检测问题的最佳解决方案。通过使用这些技术误警率成为减少和增加了欺诈检测率。通过比较这两个事例技术方法更准确和高效。
Zeager MF,等人用敌对的学习方法。这些作者首先讨论了以前的工作在这,然后扩展这个框架实际和真实世界的数据集。GMM帮助找到最优新事务的敌人可能会复制。bloom,等人也用杀工具提供综合事务的最佳策略。GMM和打给信用卡公司先发制人的能力应对变化的事务策略。这些作者改进的对手学习通过添加速度变量,以发现更多的暴露特征的事务。
Mareeswari V,等人使用支持向量机方法。该算法找到一种特殊的线性模型,最大利润超平面,它将所有的训练实例正确通过一个超平面分离成正确的类。这种技术有一些限制。SVM最大的限制在于内核的选择和第二个是速度和大小。约翰•SN等人用聚类方法来检测欺诈行为。
Rajeshwari U,等人使用流分析技术是基于时间的处理数据和使用实时决策通过检查,并分析相关的数据即使它涌入来自各种不同来源的应用程序和数据库。Rajeshwari U,等人需要历史数据模型的系统可以检测欺诈模式。流分析模型用于分析实时事务。误警率减少通过这种技术通过检查事务之间的关系,实际欺诈和那些被猜测为欺诈。火车模型根据原持卡人数据更新频繁,萨拉查,等。
使用信号处理框架也有助于减少信用卡欺诈活动。戴Y,等人关注在线信用卡欺诈检测框架,实现主要目标,通过结合多个精度检测模型和应用模型来分析大量的数据。用最新的大数据技术实现框架,有助于建立一个可伸缩的、容错和高性能系统。
Mareeswari V,等人使用HSVM技术。有一些限制现有系统可伸缩性问题,极端不平衡类和时间约束。与公共和峰值检测HSVM克服这些限制。HSVM是最常用的模式识别和分类的方法。Agrawal,等人隐马尔可夫模型用于哪些用户概要文件维护和特定用户的统计信息和统计不同的欺诈场景集群。
约翰•SN等人使用集群、人工神经网络、协会预测,分类分析客户数据以识别可能导致欺诈行为的模式。Agrawal,等人使用遗传算法,以行为为基础的技术和隐马尔可夫模型来解决信用卡欺诈。这三种技术可以应用在每个事务。隐马尔可夫模型维护以前的事务日志。以行为为基础的方法创建集群或组的数据。遗传算法用于计算阈值。Gayathri R,等人用五种不同的神经网络技术,决策树,事例,朴素贝叶斯和支持向量机。每个技术应用于每个事务之后,比较它们的性能,精度和效率的技术。Zareapoor M,等人九个不同的技术,使用贝叶斯网络、决策树、规则归纳方法,支持向量机、人工神经网络,然而算法,隐马尔科夫模型,人工免疫系统,模糊神经网络、模糊达尔文系统和遗传算法被用来克服欺诈活动。不同的技术,用于检测信用卡欺诈和评估每个方法基于精度,速度和成本。
埃德温·R,等人使用人工智能、遗传lgorithm,模糊逻辑和机器学习技术。每个技术评估基于某些设计标准。Gadi MFA,等人讨论了五种不同的分类方法,数据挖掘和比较在两种培训模式,成本敏感的训练模式,不同的假阳性和假阴性的成本被认为是在训练阶段,另一个是普通的训练模式。成本敏感培训大大提高所有远离朴素贝叶斯分类方法的性能和独立的培训模式。决策树和人工免疫系统和优化参数是最好的在我们的实验方法。沈,等人三种不同的分类方法,即。、决策树、神经网络和逻辑回归测试的适用性在欺诈检测。本文提供了一个有用的框架选择最好的模型识别信用卡欺诈风险。
约翰SN,等人讨论了最常见的神经网络技术来检测欺诈行为。神经网络技术是完全基于人脑的原则。但是这种技术也有一些限制。这种技术的地方在网络性能起主要作用,但缺乏方法存在来确定最优拓扑对于一个给定的问题由于其高大型网络的复杂性。
Agrawal,等人上面讨论所有这些技术利用基因技术,给出准确结果的算法来解决信用卡欺诈检测问题,在所有因素检测欺诈行为。所有的技术是可靠的和马哈茂德女士,等人正常工作。这些技术可以很容易地用于检测和破折号R,信用卡欺诈等人。大部分的论文数据Zareapoor讨论。Seeja年代,等人及其技术帮助相当大的减少和沈,等人使用决策树是最常见的技术和容易使用。它最有效的结果。但决策树也有一些限制,包含在决策树的决定是基于预期,这些预期导致许多错误的决策树。
安全因素是最重要的因素,只有一些技术不遵循这一因素萨拉查,等人在某种程度上违反因为欺诈检测信用卡交易数据使用的是私有的。安全意味着技术能够检测并纠正错误。
本文提出相关的比较研究不同检测方法基于信用卡(决策树、神经网络、贝叶斯网络、遗传算法、支持向量机、k最近邻和人工免疫系统,隐马尔科夫模型,模糊神经网络新方法,人工神经网络,遗传算法,聚类和模糊达尔文系统)。本文的主要目的是讨论不同的检测技术基于信用卡通过讨论不同的论文的文献综述。信用卡欺诈检测的所有数据挖掘技术在本调查中讨论论文有自己的弱点以及优点。因此,这篇论文的调查使我们能够建立一个混合方法对发展中一些有效的算法可以表现良好的分类问题与可变误分类成本和更高的精度。