石头:2229 - 371 x
P.K.Bhargavi* 1, S.Bhuvana2, Dr.R.Radhakrishnan3.
|
通讯作者:P.K.Bhargavi,电子邮件:(电子邮件保护) |
有关文章载于Pubmed,谷歌学者 |
更多相关文章请访问全球计算机科学研究杂志
基于内容的图像检索(CBIR)是将计算机视觉技术应用于图像检索问题,即在大型数据库中搜索数字图像的问题。基于内容的图像检索(CBIR)依赖于根据特征选择技术提取最相关的特征。在检索过程中,多个特征的整合会造成维数的诅咒和时间的消耗。该模型包括以下步骤:(i)从图像数据库中提取特征,采用颜色相干向量(CCV)和Gabor滤波算法提取颜色和纹理特征;(ii)使用最大熵法将数值特征替换为表示数值域间隔的标称特征,使用类属性相互依赖最大化(CAIM)算法;(iii)使用粒子群优化(PSO)算法提取最多的特征来自原始功能集的相关功能。基于CBIR的应用程序用于互联网和执法市场,以识别和审查图像。
关键字 |
基于内容的图像检索,特征判别,特征选择,蚁群优化算法 |
介绍 |
基于内容的图像检索(CBIR)是将计算机视觉技术应用于图像检索问题,即在大型数据库中搜索数字图像的问题。CBIR系统利用图像的视觉内容在数据库中检索相关图像。研究者主要是基于图像内容的高级语义分析,以及图像的视觉内容,如颜色、纹理、形状。颜色特征包括颜色直方图、颜色相干向量、颜色共生矩阵、矢量量化和颜色矩。纹理特征来源于灰度共生矩阵、Tamura特征、小波系数和基于Gabor滤波器的特征。图像特征提取出来后,在检索过程中哪些特征是相关的,这是另一个问题。拥有更多的特征意味着在分类中有更强的鉴别能力。此外,数据的高维数可能会导致“维数诅咒”问题。 |
特征约简是指研究减少描述数据的维数的方法。它的一般目的是用更少的特征来表示数据,降低计算成本,而不损害判别能力。由于特征约简具有避免过拟合、抗噪声、增强预测性能等优点。特征变换通过将原始特征空间投影到低维特征空间来构造新的特征。主成分分析和独立成分分析是两种应用广泛的特征变换方法。特征变换虽然可以获得最小维数,但其主要缺点是计算量大,输出结果难以为用户解释。 |
特征选择是根据判别能力对原始特征空间的子集进行选择,以提高数据质量的过程。本文提出了一种基于特征选择技术从整体特征中提取最相关特征的图像检索模型。利用不变特征、颜色相干向量和Gabor小波提取颜色特征和纹理特征。 |
颜色相干向量(CCV)是一个指示如何相似的颜色在图像中定向。颜色相干向量(CCV)存储每个颜色[2]的相干像素和不相干像素的数量。具有相似颜色像素集合的区域称为相干区域。CCV计算当前相干和非相干像素的数量。完全不同的图像可以有相同的颜色直方图。CCV将根据有多少个具有相当大的连续色块的区域来区分图像。为了计算CCV,我们指定了可以对颜色进行分类的箱子数量。然后,对每个像素的相邻像素进行比较,并标记出相干区域。如果该区域的大小高于阈值,则该区域被标记为相干,否则被标记为非相干。因此,通过将整个色块分成连贯或不连贯的色块,我们可以得到关于颜色散射信息的信息。 |
在图像检索过程中,Gabor小波被广泛应用于图像纹理特征的提取。基本上,Gabor滤波器是一组小波,每个小波捕获特定频率和特定方向的能量。Gabor滤波器的尺度和方向可调特性使其特别适用于纹理分析[3]。Gabor滤波器是一组捕捉特定频率和特定方向能量的小波。使用这个基础的信号扩展提供了一个局部频率描述,因此,捕获信号的局部特征/能量。 |
相关的工作 |
颜色相干向量(CCV)存储每个颜色的相干像素和不相干像素的数量。通过分离相干像素和非相干像素,CCV提供了比颜色直方图[2]更细微的区别。颜色直方图也有一些局限性。 |
颜色的一致性是指该颜色的像素在较大的相似颜色区域中成为成员的程度。我们把这些显著的区域称为相干区域,并观察到它们在表征图像方面具有重要意义。颜色相干度测量将像素分为相干和非相干两类。相干像素是一些相当大的连续区域的一部分,而非相干像素则不是。颜色相干向量表示图像中每种颜色的这种分类。 |
在计算中,CCV类似于颜色直方图的计算。我们首先通过将像素值替换为一个小的局部邻域(目前包括8个相邻像素)的平均值来略微模糊图像。这消除了相邻像素之间的小变化。然后对颜色空间进行离散化,使图像中只有n种不同的颜色[2]。 |
Gabor小波被广泛应用于图像纹理特征的提取和检索,并已被证明是非常有效的。Gabor滤波器是一组小波,每个小波捕捉特定频率和特定方向的能量。Gabor滤波器的尺度和方向可调特性使其在纹理分析中特别有用。Gabor滤波器在纹理图像特征提取中的应用受到多种因素的影响。Gabor表示已被证明是最优的意义上,最大限度地减少空间和频率的关节二维不确定性。这些滤波器可以被认为是方向和尺度可调的边缘和线(条)探测器,并且在给定区域中这些微特征的统计信息通常用于表征底层纹理信息。Gabor特征已用于多个图像分析应用,包括纹理分类和分割,图像识别,图像配准和运动跟踪。 |
支持向量机建立在结构风险最小化原则上,寻求一个决策面,可以将数据点分为两类,它们之间的裕度最大。这允许将分类器训练表述为约束优化问题。 |
遗传算法是一种有效的函数最小化方法。在描述符选择上下文中,对基于一组特征的模型的预测误差进行优化。遗传算法通过模拟解的动态种群来模拟自然进化。种群的成员被称为染色体,编码所选择的特征。编码通常采用位串的形式,设置所选特征对应的位,清除其他特征对应的位。每条染色体都有一个使用编码特征构建的模型。应谨慎选择引导染色体交叉、突变和存活的参数,使群体能够探索解空间,防止过早收敛到占据局部极小值的同质群体。在遗传特征选择中,初始群体的选择也很重要。本文提出的系统采用最大熵法进行特征识别,采用蚁群算法进行特征选择的最优解。 |
提出了系统 |
本文提出了一种基于特征选择技术从整体特征中提取最相关特征的图像检索模型。利用不变特征、颜色相干向量和Gabor小波提取颜色特征和纹理特征。利用CAIM方法将数值特征替换为表示数值域区间的离散值的标称特征,对这些特征进行识别。这些特征通过特征选择技术来提取最相关的特征,并使用PSO算法删除不相关的特征。相关特征不仅可以达到最大的识别率,而且可以简化计算,减少检索过程中所消耗的时间。系统总体流程如图1所示。 |
特征提取 |
颜色提取: |
本文提取的特征是颜色和纹理表示。颜色相干向量(CCV)是一个指示如何相似的颜色在图像中定向。具有相似颜色像素集合的区域称为相干区域。本文提取的特征是颜色和纹理表示。颜色相干向量(CCV)是一个指示如何相似的颜色在图像中定向。具有相似颜色像素集合的区域称为相干区域。CCV计算 |
输入:彩色图像 |
输出:使用颜色相干向量显示相干像素和非相干像素的值 |
步骤: |
a.给出彩色图像作为输入 |
b.将图像分为8个区域 |
c.具有相似颜色像素集合的区域为相干区域 |
d.比较相邻像素,标出相干区域 |
e.如果该区域的大小高于阈值,则该区域标记为相干的,否则标记为非相干的。 |
纹理提取: |
Gabor小波是一种有效的图像纹理特征提取方法。Gabor滤波器是一组小波,每个小波捕捉特定频率和特定方向的能量。Gabor滤波器的尺度和方向可调特性使其在纹理分析中特别有用。 |
输入:彩色图像 |
输出:纹理图像 |
步骤: |
a.给出彩色图像作为输入 |
b.将彩色图像转换为灰度图像 |
c.利用gabor滤波函数将图像提取为纹理表示, |
特征歧视: |
识别过程是提出的特征选择技术的关键步骤。图像特征提取完成后,必须采用特征识别技术[4],将连续值按照一定的阈值转换为离散值。识别过程通过产生特征值可以驻留的区间(而不是单一值),并通过将离散数值与每个区间相关联,将连续特征转换为离散特征。类属性相互依赖最大化(CAIM)算法用于判别过程。CAIM算法的目标是最大化类属性的相互依赖性,并生成(可能)最小数量的离散区间。 |
功能选择: |
特征选择是根据判别能力对原始特征空间的子集进行选择,以提高数据质量的过程。本文提出了一种基于特征选择技术[6]从整体特征中提取最相关特征的图像检索模型。特征选择技术的目标是从原始特征中选择出最好的特征。它不仅可以达到最大的识别率,而且可以简化图像检索过程的计算。特征选择技术的目标是从原始特征中选择出最好的特征。采用粒子群算法进行特征选择。粒子群优化是一种计算方法,它通过迭代尝试改进一个候选解决方案来优化一个问题。粒子群算法的结果如图4所示。 |
检索过程: |
特征向量保存在数据库中,并带有指向它们所属的模型图像的指针。在检索过程中,向系统提供查询图像,并提取图像的特征。使用欧几里得距离度量[8]将查询图像中的每个单独的特征向量与存储在模型图像数据库中的所有其他特征向量进行比较。 |
结果和讨论 |
第一个图像数据库是从www.google.com下载的。这个图像数据库由1000个图像组成。这些图像被分成10个簇,每个簇包含100张图像。将特征提取技术应用于所提出的图像数据库中,提取图像的颜色和纹理特征。颜色相干向量(CCV)存储每个颜色的相干像素和不相干像素的数量。相干像素是一些相当大的连续区域的一部分,而非相干像素则不是。颜色相干向量表示图像中每种颜色的这种分类。CCV可以防止一个图像中的相干像素与另一个图像中的不相干像素相匹配。彩色图像作为输入。将彩色图像进行区域划分,利用彩色相干向量对相干像素和非相干像素进行区分。 For each pixel the neighboring pixels are compared and the region of coherence is marked. Threshold value is set, if the size is above threshold value then the region is marked as coherent else it is marked as incoherent, which is shown in Fig.2. |
Gabor小波被广泛应用于图像纹理特征的提取和检索,并已被证明是非常有效的。Gabor滤波器是一组小波,每个小波捕捉特定频率和特定方向的能量。Gabor滤波器在纹理图像特征提取中的应用受到多种因素的影响。Gabor表示已被证明是最优的意义上,最大限度地减少空间和频率的关节二维不确定性。彩色图像作为输入。彩色图像转换为灰度图像。然后利用gabor滤波函数将图像提取成纹理表示。采用gabor小波函数显示纹理图像的值,如图3所示。判别技术中使用的方法是类属性相互依赖最大化(CAIM)。CAIM算法的目标是最大化类属性的相互依赖性,并生成(可能)最小数量的离散区间。 The results of discrimination technique are shown in Fig.4. The features discriminated are given as input for feature selection technique. |
特征选择技术采用粒子群优化算法(PSO)。粒子群优化是一种计算方法,它通过迭代尝试改进一个候选解决方案来优化一个问题。使用粒子群优化(PSO)算法将选择的特征显示为输出。 |
特征向量被保存在数据库中,并带有指向它们所属的模型图像的指针。在检索过程中,向系统提供查询图像,并按照上述方法提取图像的特征。使用欧几里得距离度量将查询图像中的每个单独特征向量与存储在模型图像数据库中的所有其他特征向量进行比较。当改进的位置被发现时,这些将来指导蜂群的运动。这一过程不断重复,通过这样做,人们希望(但不保证)最终会找到令人满意的解决办法。图像从数据库中检索,该数据库与给定的输入图像相关,如图6所示。 |
结论 |
本文采用特征提取技术,利用颜色相干向量和Gabor小波提取颜色和纹理特征。在识别过程中,采用外源方法获取最优边界,采用遗传算法进行特征选择。因此,我们提出了一种利用最大熵法将提取的连续特征转化为标称特征的特征识别技术。通过粒子群算法对该方法进行优化,分析了该方法的有效性。该模型减少了最相关特征集的搜索空间,减少了检索过程中的消耗时间。 |
通过与其他模型的精度和查全率进行比较,证明了所提模型的有效性和效率。此外,还可以使用无监督算法,如等宽间隔、等频率间隔、k-均值聚类和其他一些优化方法来改善这一问题。 |
参考文献 |
|