石头:2229 - 371 x
Thangadurai K1Bhuvana年代2Radhakrishnan R博士3
|
相关文章Pubmed,谷歌学者 |
访问更多的相关文章全球研究计算机科学杂志》上
基于内容的图像检索(CBIR)应用程序的计算机视觉技术,解决了在大型数据库中寻找数字图像的问题。这种新兴的方法包括局部二进制模式(LBP)、当地衍生模式(LDP),三元模式(LTP)和级模式。摘要当地四模式(LTrP) CBIR方法基于水平和垂直方向,还包括级模式是指统一模式和非均匀模式(i。e图像中的所有像素)。与传统方法编码参考像素之间的关系及其周边的邻国通过计算灰度差异和模式是指统一模式级只有提出包括1)。预处理和方向的像素采用预处理技术就是调整和计算一阶衍生品。2)。使用LTrP提取模式和枸杞多糖对每个像素进行分类使用利乐方向和分离成二进制模式3)。萃取模式收集使用级震级的衍生品。4)。最后,建立了混合法来提取图像的特点通过结合LTrP,枸杞多糖和级模式是用于提高性能。性能分析表明,该方法提高了检索结果的73.4% / 42.7%至79.5% / 47.8%的平均精度/平均召回数据库DB。
关键字 |
当地衍生模式,基于内容的图像检索,级模式,局部二进制模式。 |
介绍 |
近年来迅速增加在数字图像集合的大小。每一天,无论在军事还是民用设备生成giga-bytes图像。大量的信息。然而,我们不能访问或使用信息,除非它被组织,允许高效的浏览、搜索和检索。检索的过程需要大量的图片数据库是相当复杂的任务在大多数基于web的搜索引擎。基于内容的图像检索(CBIR)技术使用视觉内容搜索图像从大规模图像数据库根据用户的利益,一直是一个活跃的和快速发展的研究领域。在过去的十年中,已经取得了非凡的进展在理论研究和系统开发。然而,仍然存在许多具有挑战性的研究问题,继续吸引来自各个学科的研究者。 |
基于内容的图像检索使用一个图像的视觉内容,如颜色、形状、纹理、空间布局代表和索引图像。在基于内容的图像检索系统中,图像的视觉内容数据库中提取并描述多维特征向量。的特征向量数据库中的图像特征数据库形式。来检索图像,用户提供的检索系统示例图像或勾勒出人物。然后系统变化特征向量的这些例子到它的内部表示。相似之处/查询的特征向量之间的距离的例子或素描和数据库中的图像然后进行计算和检索与索引的援助计划。索引方案提供了一个有效的方式来搜索图像数据库。最近的检索系统注册用户相关性反馈修改检索过程以生成感知和语义上更有意义的检索结果[1]。 |
颜色和纹理通过自然图像的基本结构有密切关系,他们被认为是作为pre-attentive人类视觉感知的原子。的„„textonA¢一个¢是纹理分析中一个非常有用的概念,利用开发高效的模型在纹理识别或对象识别的背景下[2 - 5]。然而,很少有作品提出了texton模型应用于图像检索。如何获得texton特性,以及如何将底层纹理特征映射到textons需要进一步研究。为此,在本文中,我们提出一种新的图像检索描述符。基于内容的图像检索技术旨在回应查询图像与查询相似的合成图像从图像数据库中获得。查询图像也会对提取加工特性与功能的数据库图像运用合适的检索查询类似的图像相似性度量。CBIR的面积,它克服了困难的手工注释使用基于视觉特性的表征,如颜色、纹理、形状,等等。然而,经过十多年的加剧。这种方法的主要瓶颈是视觉特性之间的差距表示和图像的语义概念。纹理分析已广泛应用于计算机视觉和模式识别应用程序由于其潜力提取显著特征。 |
局部二进制模式(LBP)操作符是一个灰度图像纹理描述符。在2 d图像灰度图像纹理现象由空间结构(模式)和对比(纹理)。LBP算子的量化模式的纹理。满意的纹理描述符的目的有以下属性 |
有效的鉴别不同类型的纹理。 |
b。鲁棒性姿势和规模变化。 |
c。照明变化鲁棒性。 |
d。鲁棒性空间不均匀性。 |
e。应该适合相当小的样本大小。 |
f。计算延迟时间将会更少。 |
当地的三元模式(LTP)局部二进制模式(LBP)的扩展。阈值的局部二进制模式像素分成三个0和1而LTP使用阈值常数阈值像素分成三个值。基于内容的图像检索技术已经广泛应用包括生物特征识别、表情识别、虹膜识别、指纹识别、基于头发的人检测、图像检索、图像分割、检查表面等等。 |
相关工作 |
纹理分割方法是主要的困难。许多纹理分割算法需要纹理模型参数的估计是一个非常艰巨的任务。„JSEGA¢A分割[6]提出了克服这些问题。而不是试图估计一个特定模型纹理区域,它测试给定的彩色纹理模式的同质性。„JSEGA¢包含两个步骤。在第一步中,图片颜色是量子化的几类。更换相对应的图像像素的颜色类标签,我们可以获得一个class-map形象。然后进行空间分割这class-map可视为一种特殊的纹理成分[7]。[8]中提出的小波变换提供了一种多分辨率纹理分析和分类方法。研究人类的视觉系统支持多尺度纹理分析方法,因为研究人员发现,视觉皮层可以建模为一组独立的通道,每一个特定的方向和空间频率乐队。 That is why wavelet transforms are found to be useful for texture feature extraction. |
在[9]使用高斯混合矢量量化(GMVQ)提出了量化颜色直方图生成方法。GMVQ是健壮的量化器不匹配,激励其用在颜色直方图的查询图像和数据库中的图像。结果表明,该直方图由GMVQ与惩罚对数似(LL)失真产生更好的彩色图像检索性能比传统的统一量化方法与平方误差矢量量化失真。一个简单而又流行的量化方法是均匀量化每个像素的每个颜色通道。[9]然而,均匀量化不仅忽略了像素之间的互相依赖,也不考虑任何实际颜色分布在一个给定的图像数据库(DB)。一个新特性提取器和描述符,即Multi-Texton直方图(m)[10]中给出,用于图像检索。m可以看作是中医的一个改良版本。专为自然图像分析,可以获得更高的检索精度比边缘方向Auto-correlogram (EOAC)[11]和中医[12]。它集成了共生矩阵法的优点和直方图代表同现矩阵的属性使用直方图,并能代表颜色和纹理方向的空间相关性。 |
突出的边界检测基于层次与区域特征提取方法将大大提高检索结果的质量。许多先进的技术表明,基于语义域的图像检索系统,提高图像检索的质量组比较有意义的概念。有效的有意义的学习和推理的概念可能会证明这样的系统的关键。艺术状态的图像检索技术的范围,在进行重大技术进化[13]。一种新颖的流形学习算法,称为GIR,图像检索的定义。然后使用标准光谱技术来找到一个最佳的投影,这方面图结构。通过这种方式,减少了子空间的欧氏距离可以反映数据的语义结构。拟议的框架[14]可以有效地合并文本和图像特征的图像检索系统。将一个图像分析算法的基于文本的图像搜索引擎没有退化响应时间、多线程处理的框架。在高层语义检索系统,搜索引擎检索大量的图像使用给定的基于文本的查询利用。在低层次的图像检索过程中,系统提供类似的图片搜索功能。 |
各种技术对图像特征的提取和表示像直方图本地(对应区域或子图像)或全球布局,颜色渐变、边缘、轮廓、边界和区域,纹理和形状已经在文献中报道。直方图是一种最简单的图像特征[15]。尽管不变量对查看轴平移和旋转,缺乏包容空间信息是其主要缺点。许多完全不同的图像可能有类似的直方图作为像素的空间信息不反映在直方图。因此,许多直方图改进技术已经在文献中报道。基于直方图相交法比较模型,提出了图像直方图为目标识别[16]。 |
该方法 |
提出系统的目标检测最相关的图像数据库。摘要LTrP包括自民党、枸杞多糖、LTP和级模式用于从图像检索功能。 |
预处理和计算像素的方向: |
第一步处理图像预处理。图像的预处理,在一般情况下,处理以备主处理。有几种预处理技术,如主导变量,收紧,稀疏的,比例等等。该系统采用预处理技术就是图像大小。该方法应用于提高了图像检索的时间。 |
构建Terra模式: |
c。比较中心像素值与邻居像素值。 |
d。如果你的邻居像素值匹配的中心像素值换成„0¢。否则保留相同的邻居像素值。 |
e。最后,它给每个像素8位利乐模式。 |
从(4)和(5),我们得到了8位利乐模式为每个中心像素。然后,我们单独所有模式分为四个部分根据中心像素的方向。最后,tetra模式每个部分(方向)转换为三个二进制模式。 |
局部二值模式(LBP)是一个算子的图像描述是基于相邻像素的差异的迹象。是快速计算和不变的单调灰度图像的变化。所以中心像素的方向获得使用(4)是“1”;然后,可以定义通过隔离成三个二进制模式。每四模式分成3二进制模式基于像素值的方向。同样的,其他三个四模式剩余三个方向(部分)的中心像素转换为二进制模式。因此,我们得到了12 (4 X 3)二进制模式。 |
级建设模式: |
尽管签署组件提取更多的有用的信息与级成分相比,利用符号的组合和级机制可以提供更好的线索,在任何一个个体组成不明显。这个概念已经驱使我们提出13二进制模式通过使用水平和垂直的一阶导数的大小。 |
” |
输入:查询图像;输出:级模式的步骤: |
。选择一个像素,选择相邻的像素在水平和垂直位置,计算一个像素和相邻的像素之间的区别 |
8 b。同样选择其邻近的像素,计算所有相邻像素之间的区别及其相邻的像素。 |
c。比较像素值的差异和8个邻近的像素值的差异。 |
d。如果一个像素的差值较小比邻近的像素值的区别意味着它给„1 a¢作为级模式值。 |
e。如果一个像素的差值大于相邻的像素值的区别意味着它给„0 a¢作为级模式值 |
为本地模式与社区,枸杞多糖的变化是可能的,导致特征向量的长度。这个特征向量的计算成本计算对均匀和非均匀模式。后确定本地模式(枸杞多糖,LTP,自民党或LTrP 13-binary-pattern形式),整个图像是通过构建一个柱状图表示。 |
为了降低计算成本,我们认为通过统一的模式统一模式指的是统一的存在模式,不连贯的有限循环二进制表示。在本文中,这些模式,小于或等于两不圆二进制图像被称为统一模式,和剩余模式被称为非均匀。因此,不同的统一模式对于一个给定的查询图像将P (P - 1) + 2。后确定本地模式(枸杞多糖,LTP,自民党或LTrP 13-binary-pattern形式),整个图像是通过构建一个柱状图表示。 |
计算特征向量和查询匹配: |
提取的特征向量结合13 (LBP)级4 x3 +二进制模式使用直方图。最后,测量最相关匹配和检索的相似之处。计算每个图像的特征向量在数据库中。比较查询图像与数据库中的图片并选择top-matched图像通过测量之间的距离查询图像和图像数据库使用 |
,是th的th特征图像数据库中的数据库,查询图像的特性。 |
实验结果 |
这个数据库包含大量不同内容的图像从动物到户外运动自然图像。这些图片已经pre-characterized成不同类别每个尺寸100年由领域专家。 |
数据库中的图像包含不同的维度和其收集到的单一数据库图像。该方法的性能测量的平均精度和平均召回。性能分析表明,该方法提高了检索结果的73.4% / 42.7%至79.5% / 47.8%的平均精度/平均召回数据库DB |
结论 |
本文提出了一种新颖的方法称为LTrPs CBIR。LTrP编码图像基于像素的方向,计算了水平和垂直的衍生品。这个方法使用计算图像中所有像素的大小模式,它提高了图像检索速度和图像检索时间。在这个提议的系统,只有水平和垂直像素已经使用了导数的计算。结果可以进一步提高了除了考虑对角线像素导数计算水平和垂直方向。由于该方法的有效性,也可以适用于其他模式识别应用,如人脸识别、指纹识别等。 |
引用 |
|