ISSN: 2320 - 2459
拟Sedghi*
部门电气工程,伊斯兰阿扎德大学乌尔米亚分校,伊朗乌尔米亚
收到日期:05/10/2012修订日期:17/11/2012接受日期:16/12/2012
更多相关文章请访问raybet01
提出了一种基于图像检索特征加权组合的鲁棒、灵活、有效的图像检索系统。该方法导出形状特征、空间特征等属性简单有效,可实时提取。该系统采用了不同网格大小的Gabor滤波器,具有综合性和灵活性,可以根据userâ的需要调整特征权值来实现检索细化,并且适用于各种图像数据库的检索,具有鲁棒性。在CBIR系统中,提高检索性能的常用方法是对特征向量进行加权。本文提出了一种新的、可靠的提高检索性能的方法,并对特征加权进行了补充。基于本文的结果,我们在此指出,目前语义图像检索研究的突破关键在于Gabor纹理特征的使用。它的傅里叶以及局部图像分析的好处,使分析纹理的渐变和纹理变化,这是现实世界场景的基本属性。
图像分析,特征合成,特征提取,Gabor滤波
基于内容的图像检索系统在从像素表示计算低级特征方面表现出出色的性能,但其输出不能反映用户的总体愿望。该系统在提取包括对象及其含义、动作和感觉在内的高级特征方面表现不佳。这种现象被称为语义鸿沟,目前CBIR系统的研究需要根据所描绘的物体或场景的类型来检索图像。在庞大而多样的图像数据库中分析和解释图像数据,如在CBIR系统中,显然是困难的,因为没有关于待分析图像中单个结构的大小或规模的先验信息。图像处理和计算机视觉社区已经发展了尺度空间理论来处理这个问题。尺度空间理论包含了一个信号的多尺度表示,它本身是一个派生信号的有序集,旨在表示不同尺度水平的原始信号。尺度空间理论是基于这样一个事实,即现实世界中的物体存在于一定尺度范围内的有意义的实体,而人类对它们的感知取决于观察的尺度。根据尺度空间理论原理,为了能够从图像数据中提取信息,需要探针、传感器或操作员与实际图像结构进行交互。所提取的信息依赖于图像结构的大小和操作符大小之间的关系。在计算机时代,人类生活的所有领域都需要,并利用图像进行高效的服务。 An active research area that is in the heart of all the above domains is the extraction or retrieval of images from a database given a query (image retrieval system). An image retrieval system is a system for searching and retrieving images from a large database of digital images. The most common method of image retrieval utilizes some method of annotation such as keywords, or descriptions to the images so that retrieval can be performed over the labels. Unfortunately manual annotation is time-consuming and expensive. The answer to the previous difficulty is termed CBIR. CBIR describes the process of retrieving desired images from the image database on the basis of syntactical image features. Early research comprise of systems such as[1,2,3.].更多研究可在[4].目前大多数CBIR技术都是通过图像外观的某些方面进行检索,这取决于判断最可能传达该外观的图像特征的自动提取和比较。最常用的特征包括颜色、纹理、形状、空间信息和多分辨率像素强度转换,如小波或多尺度高斯滤波[7].
特征提取
纹理特征提取
在空间域中像素的重复模式被称为纹理;该模式可能受到噪声的污染。重复频率可能会导致纹理看起来是随机的和无结构的。纹理是图像中的视觉模式,具有同质性的属性,而不是由单一颜色或强度的存在造成的。目前,最常用的纹理特征描述方法是基于统计和变换的方法。本文采用了一种基于变换的方法。目前,基于变换的纹理特征提取方法主要采用Gabor小波。这是由于生理学研究证据表明,Gabor过滤器模拟了人类视觉系统视觉皮层中的神经元。此外,Manjunath等人在[5]中表明Gabor特征比金字塔结构、树状结构小波变换特征和多分辨率同时自回归模型的性能更好。从“母”Gabor函数中使用四个频率尺度和六个方向生成了24个小波。 Redundancy, which is the consequence of the nonorthogonality of Gabor wavelets, was addressed by choosing the parameters of the filter bank to be set of frequencies and orientations that cover the entire spatial frequency space so as to capture texture information as much as possible. The lower and upper frequencies of the filters were set at 0.04 octaves and 0.5 octaves respectively, the orientations were at intervals of 30 degrees, and the half-peak magnitudes of the filter responses in the frequency spectrum are constrained to touch each other. Each image I (x, y)根据卷积方程与滤波器组中的每个小波进行卷积其中s和t是滤波器的尺寸为Gabor小波的复共轭。此外,分别对应频率和方向的尺度。通过假设纹理区域的空间同质性,计算变换系数大小的平均值和标准偏差:
最后,利用计算得到的平均值构造每个图像的纹理特征向量偏差根据:
形状特征提取
物体的形状是由轮廓或轮廓表示的特征表面结构。形状识别是人类感知环境的方式之一。形状在CBIR系统中很重要,因为它对应着图像中感兴趣的区域。在CBIR系统设计中。
对于特定的领域,如商标和工具的轮廓,形状分割是自动和有效的。然而,对于具有异构数据库的系统则不是这样。在这种情况下,形状分割可能是困难的,有时是不可能的。在我们的建议中,使用5 × 5邻域搜索中的局部均值和标准偏差提取形状特征,使用以下公式:
式中,Z和K分别为均值和标准差滤波器的脉冲响应。为此,数据库中的每张图像都要经过一个5 × 5网格大小的Gabor滤波器组。然后得到24张输出图像。之后,类似于预过滤的图像,滤波器组每个输出的局部均值和标准偏差也使用5×5邻域计算,根据:
因此,图像中的每个像素都有24个参考像素。考虑图像中的像素和滤波器组输出中的24个对应像素,图像特征向量与任何对应像素特征向量之间的距离计算为:
计算的距离是原始图像中的像素与Gabor滤波器组输出的对应像素之间纹理相似性的度量。对于每个像素,每个距离Gabor滤波器输出中对应像素,则纹理最可能与数据库图像相似的像素为
这些结果在过滤图像称为“纹理分类图像”。
空间信息提取
空间信息是图像中表征图像区域的属性之间存在的空间关系。解决了在同构或非数据库中区分相似图像的问题。局部图像区域的质心、面积等几何属性特征是最佳位置候选;它们也是派生空间布局或信息的基础。描述空间特征的两个区域属性是基本空间特征描述符、质心和空间范围。这是因为图像数据库是复杂和异构的。虽然是基本特征,但空间描述符对于旋转和平移是不变的。空间信息提取的步骤如下:(i)计算纹理分割图像得到的二值图像中区域的质心距离,(ii)然后还分别计算纹理区域的空间范围。最后,每个region属性的元素数量归一化为100。
在上述特征描述符的基础上,我们进行了系统的开发。该系统采用综合Gabor纹理特征、纹理区域形状特征和纹理区域空间信息特征的加权组合。在欧几里得空间中对查询图像与数据库中每张图像的纹理、形状和空间信息特征进行相似性度量,公式如下:
D是欧氏距离
J为数据库图像特征向量
Q为查询图像特征向量
K = 1,2,……P
P是数据库中图像的数量
I = 1、2、3
I =1是纹理的索引
I =2是形状指数
I =3是空间信息的索引
对于每个特征向量,查询图像和数据库图像之间的计算欧式距离被归一化,因此它位于0到1之间。在相似距离计算中,由于特征向量需要加权,因此归一化是必要的。特征向量的加权对于一个多样化的数据库是必要的,因为一个特定的特征不能充分地描述一个图像,加权组合将给出一个最佳的描述。在多样化的数据库中,适用于检索类似于查询图像的图像的特征随数据库建模或构成的图像类别的不同而不同。权重分配是相似匹配过程分配给特定视觉特征的关联程度。例如,如果查询图像是机器部件的轮廓,并且数据库是不同的,但包含与查询图像相似的图像,则更适合为形状特征分配高权重进行检索,因为这是最适合检索的特征。对纹理或空间信息赋予高权重是无用的,除非数据库很窄,可以利用其他特征,特别是空间信息进行识别。该系统的设计使用户可以使用灵活的权重组合检索图像。柔性权值在某种意义上为系统提供了所需要的检索精细化和鲁棒特性。通过灵活组合不同的权重特征,可以对检索过程进行多次细化,以满足用户的需求。 For a query image Q, and k th number of images in the image database, if i numbers of visual feature vectors are considered for retrieval, different distances将会得到。由各特征距离加权和得到的有效特征距离为
式11表明权重的和必须等于单位。权重分配为1是可以分配给特定特征的最高相关度,而分配为0是最高不相关度。检索到的图像是12张最匹配的图像,其特征距离按纹理、形状升序排列为前12张。空间信息和加权特征。
采用由800张图像组成的宾夕法尼亚州立大学图像数据库的测试数据库对所提出的CBIR系统进行了测试。这些图片被手动标注为110个类别。利用随机选择的查询图像的回忆精度曲线来评估所提系统的性能[6].召回率被定义为检索到的相关对象的比例,而精度是检索到的与查询相关的对象的比例。在考虑图像与查询是否相关的情况下,使用分配给每个单独图像的注释来评估图像。实施CBIR系统是一个艰苦的过程。原因是系统设计中采用的Gabor滤波器字典指示了操作频率和获得最佳性能的滤波器数量,但它并没有现成的滤波器网格大小来提供最佳性能。在这一点上,通常可以接受较大的Gabor网格能够捕获缓慢变化的级别,而不是较小的网格大小的过滤器。因此,通过使用网格尺寸为5×5、15 × 15、25 × 25、35 × 35、45 × 45和55 × 55的Gabor滤波器计算数据库中图像的纹理特征来解决这一问题。为了评估该系统的性能,给出了一系列的查询图像,然后计算了每个查询的精度曲线。然后对所有曲线求平均值,这就得到了所谓的平均召回精度曲线。图4描述了仅使用纹理特征时CBIR系统的平均曲线。另一方面图5当这三个特征都被利用时,描绘平均曲线。在这种情况下图5权重分别为0.7、0.15和0.15。
在本文中,重点研究了纹理作为主要特征。形状和空间信息是次要特征。利用不同网格尺寸的Gabor滤波器对不同数据库中特定的局部频率图像采集的特点,将6种不同网格尺寸的Gabor滤波器组的纹理特征纳入CBIR系统。这种设计使Gabor滤波器能够最优地覆盖频率空间,并赋予系统人工智能在数据库中局部和全局“滚动”,并基于高级特征检索图像。
结果表明,Gabor滤波器可以在纯纹理图像、复杂图像和真实图像中重新播放其有效的纹理特征提取,因为这些图像虽然由恒定灰度构成,但全局图像中的各种恒定灰度构成了可以被Gabor滤波器的可调谐特性捕获的纹理。提出了一种基于Gabor纹理特征、形状特征和空间信息特征加权组合的简单、鲁棒、灵活、有效的图像检索系统。形状和空间特征的推导简单有效,可实时提取。该系统很简单,因为系统可以很容易地操作和显示结果。该系统灵活,可根据用户需要调整特征权重,实现检索细化。该算法适用于各种图像数据库的检索,具有较强的鲁棒性。在目前的CBIR系统中,提高检索性能的常用方法是对特征向量进行加权。本文提出了一种新的、可靠的提高检索性能的方法,并对特征加权进行了补充。由于该系统使用Gabor滤波器进行纹理特征提取,因此建议对不同尺寸的Gabor滤波器衍生出的系统特征进行加权。通过对Gabor滤波器六种网格尺寸的纹理特征和系统输出进行适当的数学建模,该系统具有发展为基于语义的CBIR系统的潜力。