所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

软件故障预测使用单链接聚类方法

K.C. Sujitha Leninisha
  1. PG学生,部门,Easwari工程学院,钦奈,印度Tamilnadu
  2. 助理教授,部门,Easwari工程学院,钦奈,印度Tamilnadu
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

直到现在,人们提出了各种技术预测断层倾向模块基于预测的性能。不幸的是质量改进和降低成本已经很少了。这里的主要动机是优化验收测试为客户提供高质量的服务。从这个角度看,这个提议的方法的主要目标是减少基于故障预测结果的验收测试工作使用单链接聚类和仿真模型。容易使用测试数据集进行预测和故障模块预计通过jaccard相似的措施。仿真模型的估计数量的发现故障和仿真的结果表明,最好的策略是让测试工作成正比预期故障模块的数量乘以日志(模块大小)。

关键字

Jaccard相似性指标,预测模型模拟模型,测试工作的评估。

介绍

快速发展的软件系统的规模和复杂性,质量保证活动,比如测试和检验已成为更重要的软件开发人员和软件购买者负责验收测试。故障预测模型有可能提高系统的质量,降低成本提供这些系统。早期故障预测建模已成为必不可少的容易出错的代码的识别。这些研究通常产生故障预测模型允许软件工程师开发活动关注容易出错的代码,从而提高软件质量和更好的利用资源。
优先考虑质量保证的努力,提出了技术预测断层倾向模块的概率的错误[8],预期的缺点[6],[9]或断层密度[7]。根据预测结果,测试人员可以分配有限断层倾向模块的测试工作,以找到更多的错误与较小的努力。我们的主要目标是估计减少故障预测可以达到的验收测试工作。为了实现这一目标,我们需要与适当的策略测试工作分配给每个模块后的预测。我们需要计算的预期数量发现缺点对测试资源,资源分配策略,并设置模块进行测试。测试目前进行的公司并不完整,和大多数软件系统包含故障后释放[3]。所需的测试工作实际测试通过模拟发现尽可能多的错误。评估的成本效益预测,我们需要衡量指标的努力收集、数据清理和建模。
下一节解释了相关研究正在进行故障预测。在第三节,我们解释基于架构的分析我们提出方法。第四部分描述了结果和结论。

二世。相关研究

各种研究在故障预测行业数据集已报告之前[11],[12],[13],很少有研究估计测试工作的减少或增加软件的质量通过故障预测。
Arisholm et al . 2010建议的方法建立系统的、全面的调查和评估故障预测模型[1]。评价断层倾向模型,三个主要方面:(1)数据挖掘和机器学习技术进行比较,(2)评估使用不同的指标集的影响,如源代码结构措施和改变历史/故障,(3)模型的性能比较的准确性,排名能力,成本效益的措施。
缺陷预测模型用于分配软件质量保证工作。工作需要审查代码或测试代码当预测模型评估。回顾两种常见的发现在错误预测文献(1)过程指标优于产品指标,(2)包级别的预测比文件级预测[14],而龟井静香和出版社显示文件级别的预测比包级别的预测[4]。
许多研究人员讨论概率的故障容易区分故障模块从无故障模块[15]。另一方面,一些从业者讨论的故障数量分配质量保证资源基于之前的预期的bug数量存在测试[6],[9]。一些研究人员选择的故障概率密度而不是过失或数量的错误因为大文件有更多缺陷[7]。
坟墓et al . 2000年提出预测故障发生率使用软件改变历史[2]。岁的代码或腐烂如果不必要的结构使得它难以理解或改变。处理措施的基础上,改变历史更有用的故障预测利率产品代码的度量。我们也比较各种版本的错误的代码,如果一个模块是一年以上类似的模块,年长的模块将有大约三分之一更少的缺点。,现有的版本包含较小的缺点比当前版本相同的软件项目。

三世。提出的方法

如图1所示最合适的输入数据集被视为已从历史数据集。考虑到数据集,预测模型用于分析指标在源代码和设计文档。基本指标在现有版本中已经存在的行数和变化指标是添加和删除的行数在当前版本。一旦基础指标和指标变化分析,单链接聚类方法用于分析模块依赖信息基于最小距离。Jaccard相似性度量是用来计算距离。基于模块的距离测量,仿真模型是用来分配每个模块的测试工作。每个模块的测试工作分配计算基于给定的测试工作分配策略。计算测试工作后,发现模型发现出错对给定的测试资源,资源分配策略和组模块进行测试。故障发现模型计算发现错误在每个模块基于测试工作和模块的大小。最初的缺点之前测试的数量和发现错误的预期的数量在每个模块由测试人员确认。 So that testing time and testing costs are reduced by the tester to provide better services to the customer.
图像

一个预测模型。

预测模型进行了分析基础指标和指标变化在源代码和设计文档。如表1所示,源代码的基本指标是识别现有版本的行数和变化指标显示的行数当前版本中添加和删除的行数。在这个预测模型,我们需要预测断层和断层密度的数量和他们的预测性能比较。
图像

b。单链接聚类

单链接法是最好的分级方法和操作通过加入两个最相似的对象在每一步,没有在同一个集群。两个集群的相似性是他们最相似的成员的相似性。如图2所示,两个集群之间的联系是由单个元素,即那些最亲密的两个元素。在单链接聚类,分析了模块,然后依赖信息的提取。基于依赖信息模块距离计算
图像
如图3所示,两个星团通过最短的距离结合到集群,每一步,我们合并集群的最亲密的一对,直到某个终止条件满足。计算,jaccard相似性测量使用。即Jaccard相似性度量是单键方法。,it identifies the minimum distance between any two points in the two clusters. Jaccard similarity measure is defined as number of attributes common in two clusters divided by total number of attributes in both clusters.
图像
然后模块集群基于jaccard距离度量。如方程1所示,Jaccard相似性度量,用于识别的相似度和多样性两个集群C1and集群C2。Jaccard系数用来衡量模块之间的相似度的定义是交集的大小除以联盟的大小。
图像
测试工作的评估
在这个模块7可能的测试策略进行比较选择最佳策略,分配每个模块的测试工作。
[1]等于所有模块的测试工作。
这种策略被认为是一个基准策略。
[2]基于新模块大小的测试工作。
总.Si ti = t / S
ttotal在哪里总所有模块的测试工作,如果是i模块和S总规模是所有模块的总大小。
分配更多的测试工作更大的模块,行业使用这个基本策略。Arisholm等。[1]指出,努力需要测试或检查模块大致大小成正比。事实上,许多公司利用基线值的测试用例密度,如在操作测试必须运行测试用例至少10‰行代码
[3]基于新的和修改模块的测试工作。
图像
图像
战略6分配更多的更大的模块的测试工作;如果整个测试工作是有限的小模块的故障可能不会被发现。策略7试图减少的影响非常大的模块,同时还给予额外的测试工作更大的模块。仿真模型表明,最好的策略是让测试工作成正比”预期故障模块的数量×日志(模块大小)”。根据预测结果和总测试工作,每个模块的测试工作分配计算基于给定的测试工作分配策略。

d。故障发现模型

故障发现模型估计,发现错误的资源分配策略,给出测试资源和设置的模块进行测试。这个模型计算发现错误在每个模块基于给定的测试工作和模块的大小。在这个故障的发现模型中,故障检测率成反比的大小模块。我所有的模块都有相同的参数。e,给定一定的测试工作和相同模块大小,易于发现错误变得相同。最初的缺点之前测试的数量和检测单位时间内每个故障的概率是识别和发现错误的预期的数量在每个模块标识。

第四结果与讨论

这项提议的方法的结果依赖于故障发现模型中,我们扩展指数软件可靠性增长模型。这个提议的方法收集的数据集是一个软件项目的不同版本。指标分析源代码和设计文档的合适的数据集。模块集群基于jaccard相似措施和遵循单链接聚类方法分析模块依赖关系信息。后一组可能的测试策略应用于检测故障模块使用仿真模型。考虑到预测结果和测试工作,每个模块的测试工作分配计算基于给定的测试工作分配策略。这七个战略绝不是完整的。在未来找到更好的策略,我们需要与其他策略进行仿真模型。使用故障发现模型预期的数目的故障预测。我们期望进一步研究提高该模型更准确、更现实。

V的结论

在这个提议的方法中,我们提出了一个名为单链接聚类的方法,帮助测试人员定位相关的缺点,减少了测试工作通过分析模块依赖关系信息。使用仿真模型,有七个测试工作分配策略相比,评估故障预测的成本效益。策略4和7是两个最好的策略可能减少测试工作。通过使用7日策略与我们最好的故障预测模型,可以减少25%的测试工作实际测试发现尽可能多的错误。达到减少测试工作只有在适当的测试策略是使用与故障预测精度高。在未来,这将是重要的研究是否有可能为从业者提供另一个工具来减少测试成本或增加生产的质量测试。

引用

  1. e . Arisholm l . c . Briand, e . b . Johannessen”的方法建立系统、全面的调查和评估故障预测模型,”j .系统和软件,83卷,没有。1,2-17,2010页。
  2. t . l .坟墓,a·f·卡尔j . s .栗色的h . Siy,预测故障发生率使用软件改变历史,“IEEE反式。软件工程,vol.26,没有。7,653 - 661年,2000页。
  3. 信息技术促进机构、日本(IPA)软件工程中心(SEC) ed,”白皮书在软件开发项目在日本,2010 - 2011年版”,isbn978 - 4 - 9905363 - 3 - 6日,2010年。
  4. a . Monden y龟井静香,k .松本”基于svm的经验评估软件可靠性模型,“Proc。第五ACM-IEEE经验软件工程国际研讨会(ISESE2006),卷2,39-41,2006页。
  5. y龟井静香,松本,a . Monden k .松本b·亚当斯和A.E.哈桑,“回顾常见错误使用努力意识到模型预测结果,“Proc, 26日IEEE。
  6. a t m . Khoshgoftaar迪亚,d .陈年“应用神经网络预测程序的错,”《软件工程,1卷,第154 - 141页,1995年。
  7. p . Knab m . Pinzger, a·伯恩斯坦,“预测缺陷密度与决策树学习者”源代码文件,Proc。第三次工作会议在挖掘软件存储库(MSR2006), 119 - 125年,2006页。
  8. s . Lessmann b . Baesens cμ,s . Pietsch“基准分类模型对软件缺陷预测:拟议的框架和新奇的发现,“IEEE反式。在软件工程中,34卷,没有。4、485 - 496年,2008页。
  9. p . l . Li j . Herbsleb m·肖和b·罗宾逊,“经验和结果初始场缺陷预测和产品测试优先级ABB公司的努力,“Proc。28日如Conf.软件工程,pp.413 - 422, 2006。
  10. t·曼德和r . Koschke“重新评估缺陷预测模型、“Proc。预测模型在软件工程国际会议(承诺' 09),页1 - 10,2009。
  11. n . Nagappan t球,a .西“采矿指标预测组件故障,”Proc。28日如Conf.在软件工程(ICSE2006) pp.452 - ?,2006年。
  12. n .欧胜,h·阿尔贝里“预测容易出错的软件模块在电话交换机,“IEEE反式。软件工程,22卷,不。12日,第894 - 886页,1996年。
  13. t . j . Ostrand e . j . Weyuker, r·m·贝尔”预测故障的位置和数量在大型软件系统中,“IEEE反式。在软件工程中,31卷,没有。4、340 - 355年,2005页。
  14. 答:散粒,t·齐默尔曼,a .西”在设计时预测组件故障,“Proc。2006 ACM和IEEE国际研讨会上经验软件工程(ISESE ' 06),页18-27,2006。
  15. B。Turhan, t·孟。本,j . Distefano“跨公司的相对价值和公司内部数据缺陷预测”,软件工程经验,14卷,不。5,540 - 578年,2009页。
全球技术峰会