关键字 |
CBIR,纹理,小波变换,HSV。 |
介绍 |
由于数字设备和个人电脑的普及,包括图像和视频在内的多媒体数据在我们的生活中急剧增加。海量的媒体数据给如何有效地从大型多媒体数据库中检索内容带来了严峻的挑战。图像数据库的基本要求是对图像执行基于内容的搜索。术语基于内容的图像检索(CBIR)似乎起源于Kato[2]的工作,用于根据现有的颜色和形状从数据库中自动检索图像。从那时起,该术语被广泛用于描述基于图像的句法特征(颜色、纹理和形状)从大量数据库中检索所需图像的过程。系统首先对查询图像进行特征提取和存储,然后对数据库中的所有图像进行遍历,提取每个图像的特征。结果是其特征与查询图像最相似的图像。在新的信息化社会中,图像检索是一个日益重要的领域。大量分布的科学、艺术、技术和商业图像集合正在成为一个共同点,因此用户需要复杂而精确的方法来执行基于相似性和语义的查询。其发展的原因是,在许多大型图像数据库中,传统的图像索引方法已经被证明是不充分的,费力的,并且非常耗时。 These old methods of image indexing, ranging from storing an image in the database and associating it with a keyword or number, to associating it with a categorized description, have become obsolete. |
CBIR通常通过低级视觉特征(如颜色和纹理)对图像进行索引。视觉特征不能完全表征语义内容,但它们更容易集成到数学公式[3]中。提取能准确地表示查询图像的良好视觉特征是基于实例检索的重要任务之一。颜色是应用最广泛的底层视觉特征之一,它不受图像大小和方向的影响。图像的每个像素都可以表示为3D颜色空间中的一个点。图像检索中常用的颜色空间有RGB、HSV(或HSL、HSB)和对手颜色空间。然而,适合图像检索的颜色空间的理想特征之一是其均匀性[5]。均匀性是指在颜色空间中相似距离相等的两种颜色对被观察者视为相等。在HSV(或HSL,或HSB)中,空间被广泛应用于计算机图形学中,是一种更直观的描述颜色的方式。颜色的三个组成部分是色相、饱和度(明度)和值(亮度)。 The hue is invariant to the changes in illumination and camera direction and hence more suited to object retrieval. RGB coordinates can be easily translated to the HSV (or HLS, or HSB) coordinates by a simple formula [6]. Since any pixel in the image can be described by three components in a certain color space (for instance, red, green, and blue components in RGB space, or hue, saturation, and value in HSV space), a histogram, i.e., the distribution of the number of pixels for each quantized bin, can be defined for each component. Clearly, the more bins a color histogram contains, the more discrimination power it has. When an image database contains a large number of images, histogram comparison will saturate the discrimination. To solve this problem, the joint histogram technique is introduced [7]. |
本文的组织结构如下,在本节第2部分,伴随着色彩特征的分析;给出了HSV颜色空间的量化方案和提出的算法。第三节详细介绍了基于纹理特征的小波变换算法。第4节介绍了性能评估和相似度度量。第五节给出了该算法的实验结果,并与其他算法进行了比较。因此;我们结束第6节的评论。 |
2颜色量化 |
颜色直方图表示图像中颜色的分布,通过一组箱,其中每个直方图箱对应于量化颜色空间中的一种颜色。给定图像的颜色直方图由一个向量表示: |
|
其中i是颜色直方图中的颜色箱,H[i]表示图像中颜色i的像素数量,n是颜色直方图中使用的箱子总数。通常,图像中的每个像素将被分配到颜色直方图的一个bin中,其中每个bin的值给出了具有相同对应颜色的像素的数量。归一化直方图H "表示为 |
|
在哪里P是图像[13]的像素总数。所提出的方法的框图如图1所示。 |
A.提出了无DWT的颜色直方图算法 |
取查询图像,将RGB色彩空间转换为HSV色彩空间。将HSV中的每个像素量化为bin,然后与总像素相除归一化,查询图像被占用。计算了归一化直方图的均值、方差和偏度。将值存储在颜色特征向量中。 |
按照以下步骤操作。 |
1.读取输入图像 |
2.将RGB颜色空间转换为HSV颜色空间 |
3.将HSV空间中的每个像素量化为48个直方图箱。 |
4.归一化直方图是通过除以像素总数得到的。 |
5.计算归一化直方图的平均值,方差和偏度。 |
6.将值存储为颜色特征向量(C)。 |
7.对数据库中存在的图像重复步骤1到6。 |
8.计算查询图像与数据库中现有图像的相似度度量 |
9.对数据库中的所有图像重复步骤7到8 |
10.检索图像 |
3离散小波变换 |
离散小波变换(DWT)[14]用于将图像从空间域变换到频域。小波通过低通滤波器和高通滤波器对不同尺度的信号进行精确的信息变换。小波具有多分辨率和良好的能量压缩能力。小波对于颜色强度的变化具有鲁棒性,可以有效地捕获纹理和形状信息。它可以随时间线性计算,因此允许非常快的算法。本文采用Haar小波来计算特征签名,因为Haar小波计算速度最快,在[16]的实际应用中也有很好的表现。Haar小波使我们能够加快图像中数千个不同大小滑动窗口的小波计算阶段。所提出的方法努力提取查询图像的基本特征,并将其与数据库图像进行比较。所考虑的图像特征是使用DWT概念的纹理。所提出方法的框图如图2所示。 Fig |
A.基于小波的颜色直方图算法 |
小波变换为纹理分析和分类提供了一种多分辨率的方法。对人类视觉系统的研究支持多尺度纹理分析方法,因为研究人员发现视觉皮层可以被建模为一组独立的通道,每个通道都调谐到特定的方向和空间频段。这就是为什么小波变换被发现是有用的纹理特征提取。按照以下步骤操作。 |
1.从图像中提取红色、绿色和蓝色成分。 |
2.用haar小波变换对红、绿、蓝分量进行三级分解,得到近似系数和垂直、水平、对角线系数。 |
3.结合红、绿、蓝分量的近似系数 |
4.同样地,将红、绿、蓝分量的垂直、水平和对角线系数结合起来 |
5.将近似系数、垂直系数、水平系数和对角线系数隐入HSV平面 |
6.将HSV空间中的每个像素量化为48个直方图箱。 |
7.归一化直方图是通过除以像素总数得到的。 |
8.计算归一化直方图的平均值,方差和偏度。 |
9.将值存储为纹理特征向量(T)。 |
10.对数据库中存在的图像重复步骤1到6。 |
11.计算查询图像与数据库中现有图像的相似度度量 |
12.对数据库中的所有图像重复步骤7到8 |
13.检索图像 |
V.PEFORMANCE评价 |
检索系统的检索性能可以从查全率和查准率两个方面来衡量。召回率衡量的是系统检索所有相关模型的能力,而精度衡量的是系统仅检索相关模型的能力。有报道称,直方图通过召回率和精度值给出了最好的性能[17,18]。它们被定义为 |
|
A.相似度测量 |
相似度度量是CBIR算法的关键。这些算法搜索图像数据库,以找到与给定查询相似的图像,以便能够评估图像之间的相似度。为了度量相似性,数据库中的图像与查询图像之间的直接欧几里得距离为 |
|
其中Vpi和Vqi分别是图像p和查询图像q关于大小为“n”的特征向量。 |
VI.EXPERIMENTAL结果 |
|
|
|
|
|
|
|
7结论 |
从数据库中自动分析和检索图像是一项具有挑战性的任务。困难来自于许多问题,例如图像中人造物体和自然物体的复杂混合。早期对CBIR的研究大多只使用了多种颜色和纹理特征中的单一特征。然而,由于图像通常包含多种视觉特征,仅使用单一特征很难获得令人满意的检索结果。该方法为输入查询图像在图像数据库中提供了一个简单的基于颜色的搜索,使用颜色和纹理将与输入图像相似的图像作为输出。实验结果表明,与正态直方图相比,本文提出的小波变换方法具有较好的识别效果。 |
表格一览 |
|
表1 |
|
|
数字一览 |
|
|
图1 |
图2 |
|
|