石头:2229 - 371 x
Kanchan Saxena* 1和Vineet Richaria2
|
通讯作者:Kanchan Saxena,电子邮件:(电子邮件保护) |
有关文章载于Pubmed,谷歌学者 |
更多相关文章请访问全球计算机科学研究杂志
许多分类器融合方法最近已经开发了一种替代方法,导致分类性能的潜在改进。由于信息融合本身的理论很少,目前我们面临着针对不同问题设计不同的方法,产生不同的结果。本文综述了各种分类技术在融合技术中的应用,以获得最优的分类结果。分类是监督学习的一个例子。分类是一种数据挖掘功能,它将集合中的项分配给目标类别或类。分类的目标是准确地预测数据中每种情况下的目标类别,为了提高分类器的准确性,使用了许多分类技术,如k-最近邻(knn)、支持向量机(svm)、聚类等。近十年来数据速度的增长与日俱增。互联网产生了大量的非结构化数据,这些数据包括文本、文档、视频和图像。数据的挖掘需要分类。分类作为监督学习的一部分,在这种技术中,数据的挖掘是以一种有指导的方式进行的。我们客观地回顾了与数据分类相关的各种研究和期刊论文,使用了不同的方法,如knn(k-nearest neighbour), svm(support vector machine),聚类和分类。在最近的研究中,数据挖掘发展出一种新的新兴技术,这种技术被称为数据融合。
介绍 |
分类是一种数据挖掘功能,它将集合中的项分配给目标类别或类。分类的目标是准确预测数据中每个案例的目标类别。在训练集和测试集的基础上进行分类。 |
假设我们有一个集合=[苹果,手机,纸,包,笔,硬币] |
训练集={属性集合} |
苹果=苹果的属性={甜的,红的,固体的} |
移动=移动属性={固体,环形,光} |
Paper= Paper属性={读,写} |
袋=袋属性={布,皮,实,空间} |
硬币=硬币属性={实心,薄,圆} |
Testset ={固体、环、光、读取、赖特、固体、布、皮革、固体、空间,固体,薄,圆}。 |
现在我们必须根据共有的公共属性对集合进行分类 |
c1, c2, c3 ,....................................... 厘米 |
cM=混淆矩阵。 |
混淆矩阵显示了与测试数据中的实际分类相比,模型做出的正确和不正确预测的数量。矩阵是n × n的,其中n是类的个数。有一点很重要,为了提高分类的性能,必须尽量减少混淆矩阵 |
关于数据融合 |
合并多系统检索结果数据融合算法接受两个或多个排序列表,并将这些列表合并为一个排序列表,目的是提供比所有用于数据融合的系统更好的效率。 |
a.结合来自不同系统的证据,从而提高绩效 |
i.使用数据融合来实现比过程中涉及的单个系统更好的性能 |
b.同样的思想也用于不同的查询表示 |
2融合相同请求的不同查询表示的结果,以获得更好的结果 |
数据挖掘融合的发展趋势: |
本文综述了信息融合技术在数据挖掘领域的主要应用。这些用途大致可分为三类 |
1.预处理。 |
b。2。建筑模型 |
c。3。信息提取 |
现在,公司、行业和研究人员都可以获得大量的数据。因为收集数据很容易,通常也很昂贵。然而,大多数数据都是原始的,要想有用,就必须从中提取相关知识。数据库中的数据挖掘(DM)和知识发现(KNN)是研究和提供知识提取方法的领域,数据挖掘利用信息融合技术来提高所提取知识的质量。主要有三种用途:- |
a)预处理中的信息融合——在应用数据挖掘方法之前,融合用于提高原始数据的质量。 |
b)建立模型的信息融合——从数据建立的模型使用某种信息融合技术(例如;用于融合部分结果的特定聚合运算符) |
c)用于提取信息的信息融合——从数据中提取的知识是特定信息融合技术的结果。(如。由数据计算出的聚合值。) |
文献调查及相关工作: |
本节对融合技术的分类性能进行了广泛的文献综述。我们研究了各种研究论文和期刊,了解了分类器的性能,并给出了更好和准确的融合结果。这里不描述所有的方法和过程。但在分类领域的一些相关工作中,却以作者的姓名和各自的职称来进行讨论。 |
a) Muhammad A.Khan, Zahoor Jan和Anwar M. Mirza(“集子集和旋转的最小特征的分类器融合模型的性能分析”)在这篇论文中(分类)领域,在这篇论文中,我们研究了分类器融合系统应用于性别分类问题的三个方面。本文的研究结果表明,与单个分类器相比,“分类组合”通常具有更好的性能,但在融合分类器中使用了不同的模型,如SINGLE、BEST、FIXED RULE COMBINER和classifier COMBINER模型。每种模式都有其优点。本文研究了固定分类器和分类器的分类效果优于单最佳分类器。我们使用固定组合器作为具有任意数量特征的旋转数据集上性能更好的模型,使用分类器组合器模型在使用最小数量特征的旋转数据集上具有更好的性能。 |
b)由Sampath Deegalla和Henrik Bostrom(“改进最近邻分类的降维融合方法”)这篇论文,在(分类)领域,我们在这篇论文中研究了“两种新的融合特征和分类器的方法与高维最近邻分类器的三维降维方法” |
c)由Norman Poh和Samy Bengio(“在生物特征认证任务中使用嵌合构建融合分类器:一项研究”)在(分类)领域的论文,在这篇论文中,我们研究了(“如何使用嵌合数据库构建模型,据我们所知,这种方法以前还没有被研究过。这项初步研究的一个重要结论是,与在真实用户上训练相比,来自嵌合用户数据库的融合算子不会提高或降低(在真实用户上)的泛化性能。”目前的研究旨在回答第二个问题。在BANCA数据库和四种不同的融合操作符上测试了四个分类器和多达3380个人脸和语音双峰融合任务(通过4种不同的协议),这项研究表明,在真实用户数据库上测试时,生成多个嵌合数据库与仅使用真实用户数据库相比,不会降低或提高融合操作符的性能。 |
d)由Abdul Majid,Asifullah Khan和Anwar M.Mirza(“使用离散余弦变换的性别分类:-不同分类器的比较”)在(分类)领域的这篇论文中,我们研究了(“,使用400个标准/ramal面部图像库的性别分类问题,使用5个分类器,即K-mum, K-nearest neighbors。线性判别分析(LBA)。性别分类系统可分为特征提取和分类两部分。主要思想是应用DCT来减少信息冗余,并比较不同分类器在不同条件下在该域中的性能。对于输入的人脸图像,系统首先计算并选择有限的DCT效率。将它们作为输入输入到所选的分类器。最后分类器输出关于性别人脸的预测。”) |
e)由Claude Tremblay和Pierre valin(“个体分类器的实验和一组分类器的融合”),这是一篇论文,在(分类)领域,我们研究了(“一种基于个体结果融合的船舶红外图像识别新方法,以获得更可靠的决策。结果表明,个体分类器可以是一个很好的选择。在我们的特殊情况下,个体dsclassifier表现更好。这种方法的优点是我们使用简单的算法。”) |
f) Fabien Scalzo1, George Bebis2, Mircea Nicolescu2, Leandro Loss2(“性别分类的特征融合层次结构”)涉及分类领域,在这篇论文中,我们研究了一个由进化学习算法构建的图像分类的层次特征融合模型。该模型具有组合局部斑块的能力,这些局部斑块的位置、宽度和高度在学习过程中自动确定。该表征框架采用两级层次结构,将特征融合和决策融合结合为一个统一模型。层次结构本身是在学习过程中自动构造的,以产生最优的局部特征组合。不同分类器的比较评估提供了一个具有挑战性的性别分类图像数据库。它展示了这些特征融合层次结构(FFH)的有效性。 |
g) Ming Li和Ronan Sleep(“用判别特征提取和融合改进旋律分类”)在分类领域研究了判别特征提取和融合的一般方法,建立在判别分析的最优特征转换上。实验结果表明,该方法在显著降低原始特征空间维数的同时,提高了原始特征空间的判别能力。我们的特征融合方法可以在减少的低维子空间中进行,从而进一步提高了精度。我们的实验只基于单声旋律的音高序列对音乐风格进行分类。 |
h)作者:董江*,庄大方,黄耀欢,傅景英(“多传感器数据融合的进展:算法和应用”)介绍了多传感器卫星图像融合的最新进展。首先介绍了目前最流行的融合算法,重点介绍了它们的最新改进。介绍了遥感技术在目标识别、分类、变化检测和机动目标跟踪等主要应用领域的研究进展。然后讨论了这些应用程序的优点和局限性。提出的建议包括:(1)融合算法的改进;(2)开发“算法融合”方法;(3)建立自动质量评估方案。 |
确认, |
作者要感谢匿名审稿人对论文的仔细阅读和提出的改进建议。 |
结论 |
本文在总结前人研究成果的基础上,探讨了分类器组合比单一分类器效果更好。 |
参考文献 |
|