所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

调查使用分类和基于特征的图像检索相关性反馈技术

Keyuri m . Zinzuvadia1教授,Bhavesh Tanawala2教授,Keyur N.Brahmbhatt3
  1. PG学生,计算机工程系,B.V.M.工程学院,诉诉Nagar,印度
  2. 计算机工程系助理教授,B.V.M.工程学院,诉诉Nagar,印度
  3. 助理教授,信息技术部,B.V.M.工程学院,诉诉Nagar,印度
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

现在一天,数字世界随着带宽的增加,手持设备、存储技术和社交网站和大量的图像存储在web中。有明显巨大图像数据库很难对这些数据进行挖掘和检索相关的图片。基于特征的图像检索是一个非常重要的研究领域的图像处理领域。它是由低层次特征提取,如颜色、纹理和形状相似的措施的对比图片。最近,研究集中在FBIR缩小语义鸿沟,低水平的视觉特性和高水平之间的图像语义。在这篇文章中,我们提供了比较研究的各种方法用于FBIR系统的每一步。在提出系统架构HSV空间直方图将用于颜色信息提取。伽柏过滤器将使用纹理特征和形状特征提取将提取利用不变矩方法。在这项研究中多个特征提取将以上三种方法相结合使用。基于提取的特征应用支持向量机分类技术。 Here classification reduce the search space and reduce retrieval time. After that for given relevant images relevance feedback algorithm is applied which provide user intension for resultant images to the system .This increase classification accuracy by taking feedback from user which decrease semantic gap.

关键字

FBIR、特征提取、颜色、质地、形状、分类技术

介绍

在我们的数字世界中,多媒体数据起着至关重要的作用在每一个领域,如电子商务、娱乐、教育、医学、航天等等。互联网使用的不断增加和手持装置有一个每天大量的数字图像生成。所有有用的信息提取正确是否有效地存储,索引准确,容易搜索和检索.Image矿业处理图像检索、索引和存储。这是结合图像处理和数据挖掘技术。增加访问互联网的带宽可用性将允许用户搜索和浏览视频和图像数据库位于远程站点[6]。因此,快速、准确的从大型数据库检索的图像是一个重要的问题需要解决。
基于特征的图像检索(FBIR)或基于内容的图像检索是基于视觉图像的检索功能,如颜色、纹理和形状。FBIR系统的最终目标是避免使用文本描述图像的用户。这种textual-based图像检索系统总是存在两个问题:种昂贵人工注释和不准确和不一致的自动标注。另一方面,与人工注释相关的成本太高而对大规模数据集[4]。结果fbir提取视觉内容的图像颜色、形状、纹理、边缘、布局和所需的图像从大量的图像检索功能,可以自动提取的基础。
大多数FBIR系统以这种方式工作:加载查询图像,提取特征向量从查询图像。每个图像的特征向量提取数据库和所有特征向量的集合,是组织匹配查询图像的特征向量,从数据库中相关的图片。基本FBIR系统的框图见图1。

特征提取

特征提取是fbir的过程最重要的一步。低功能分为三种类型,中产和高水平。低层次特征颜色,纹理和中等水平特征是形状和高水平的功能语义鸿沟的对象[13]。颜色是迄今为止最常见的用于FBIR视觉特性,主要是因为简单的从图像中提取颜色信息。纹理和形状也是人类视觉感知的重要组成部分。喜欢的颜色,这使得它时必不可少的特性考虑查询图像数据库。功能详细描述如下。

颜色特征

在图像检索中,颜色是广泛使用的特性。是用许多方法来提取图像的颜色特征。这里的一些方法。提取图像的颜色特征的内容,我们需要选择一个颜色空间提取并使用它的属性。
共同点,颜色定义在三维空间。在数字图像的目的,RGB颜色空间是最普遍的选择。RGB颜色空间的主要缺点是它是感知不均匀和设备相关系统[2]。HSV颜色空间是一个直观的系统,描述一个特定颜色的色调,饱和度和亮度值。HSV直方图显示的频率发生的每一种颜色在图像根据其强度,它显示了全球描述颜色的图像。通过匹配直方图存储在数据库可以检索相关的图片。
一阶(平均),第二个(标准偏差)和三阶(偏态)颜色的时刻已经被证明是有效的和有效的代表颜色分布的图像。as低维向量,但对于所有类型的图片可能不给准确的结果[2]。有MPEG-7标准也提供一组丰富的标准化描述符和描述方案来描述图像和音频等多媒体内容。Mpeg - 7代表多媒体内容描述接口。MPEG-7有五个颜色描述符命名为主要颜色,可伸缩的颜色、结构、颜色布局和组帧的颜色。它允许快速和高效的内容识别和解决大范围的应用[5]。
基于区域的图像检索技术主要是使用或颜色特征提取。由于不准确的分割,分割区域的平均颜色可能不同于原来的地区。获得图像的主要颜色,首先获得了直方图,然后最大大小的本被认为是该地区的主要颜色[3]。

纹理特征

自然图像的纹理是一个重要的特性。图像纹理视觉模式可以被定义为图像的自然纹理的表面和人为创造的视觉模式。它包含重要的信息即表面的结构安排。,clouds, leaves, bricks, fabric, etc.A variety of techniques have been developed for measuring texture similarity.
常见的小波变换的纹理描述符,Gabor-filter,同现矩阵和田村特性在MPEG-7两个描述符相关结构称为同质纹理描述符和非同质纹理描述符(边缘直方图)[5]。边缘直方图描述符用于纹理。和CCH(对比上下文直方图)找出查询图像的特点和其他图像存储在数据库中。CCH空间域,它提供了全球分销[5]。应用灰度共生矩阵建立灰度共生矩阵法()方法,它是基于条件概率密度函数。同现矩阵是一个函数的距离和方向。GLCMs已经非常成功地用于结构计算。应用灰度共生矩阵建立从所有的特性计算并存储到数据库中[10]。
伽柏是广泛采用提取纹理图像的检索和已被证明是非常有效的因为它有类似的特征与人类感知。基本上伽柏滤波器有可调方向和径向频率带宽,可调中心频率和最优实现联合决议在空间和空间频率[17]。田村特性包含六个特征如粗糙,相反,方向性,line-likeness、规律性和粗糙度。粗糙,对比度和方向性与人类感知强烈相关,因此他们是非常重要的。

形状特征

图像中对象的形状是最重要的属性之一,用于图像重组和检索的任务fbir [18]。没有通用功能和技术最适合每一种形象[3]。功能良好表示一个对象应该不变的翻译、旋转和缩放,最常用的形状描述方法可以基于边界或地区。有几种方法可用于形状表示,总结了傅里叶描述符,如小波描述符,基于网格的。在MPEG-7视觉形状描述符包含3 D形状描述符,提出描述符,Contour-Based形状描述符和2 - D / 3 D形状描述符[5]。
M玛丽Helta雏菊,博士。TamilSelvi和Js。GinuMol提出方法提取形状特征利用傅里叶描述符和质心的距离,伽柏过滤器用于从图像中提取纹理特征[8]。通过结合傅里叶描述符特性和伽柏滤波器特性以及形态合闸操作的结果是改善与只使用一个特性。边缘方向直方图的方法捕获图像的一般形状信息。这个信息被获取使用精明,sobel算法和边缘方向是量子化的存储在垃圾箱。这种技术提供了尺度和旋转不变性[3]。
在提出描述符,时刻很受欢迎。这些包括不变的时刻,和勒让德泽尼克时刻时刻。不变的时刻一样或几何的时刻是最简单的功能和他们不变的翻译、规模变化、镜像和旋转[18]。泽尼克时刻源于正交泽尼克多项式。因此,它是一个正交的时刻。还他们健壮的噪音和小形状的变化。但泽尼克时刻的计算复杂度高。勒让德时刻用勒让德多项式核函数。基于小波的形状表示也给比精明和sobel算法更好的结果。在这个他们利用形状表示Daubechies和Coiflets小波给性能增加识别形状[9]。

分类方法

分类和聚类图像挖掘的重要组成部分。这机器学习技术是用来减少语义低层图像特征和高层语义之间的差距。数据分类是一个twostep过程,由一个学习步骤,分类步骤[21]。分类算法应用于图像数据库中图像是最好的描述对这类进行分类。分类是富有挑战性的任务在不同的应用领域,包括生物医学成像、生物统计学、视频监控、车辆导航、工业视觉检测、机器人导航、遥感、手写信件重组[12]。图像分类主要有三个步骤[1]:
,特征提取,在此步骤功能从样本中提取的图像已经贴上标签,建立每个图像的特征描述。
b。训练——在这方面,每个类的样本训练和模型描述每个类。
c。分类,使用模型的分类和索引图像没有标签。
有多种方式结合分类技术和特征提取技术。苏丹Aljahdali Aasif安萨里提出了基于特征的图像检索方法的过程和应用伽柏过滤纹理特征提取技术[15]。他们已经尝试这个方法与支持向量机监督分类技术和不使用它。他们的结果表明,伟大的改善结果通过使用支持向量机分类技术。但他们只考虑纹理特征不会给最好的结果为所有类型的图像[15]。有一些比较也有支持向量机分类器。
d . Jeyabharathi Dr.A。Suruliandi各种特征提取技术相比有不同的分类方法[16]。他们探索PCA, LDA和ICA特征提取技术。的基础上,支持向量机和近邻分类器进行了比较。他们的实验结果评估是基于重组率和F分数。基于结果他们得出结论,PCA与SVM准确结果比近邻技术[16]。文献调查各种技术进行分类标记和未标记的图像可在[14]。如支持向量机,D-Em,射频,主动学习,转换学习技术解释。他们给了一些建议选择模糊集理论和粗糙集理论根据我们的应用[14]。
Apostolos Marakakis,尼古拉斯·Galatsanos Aristidis lika提出了相关反馈方法与支持向量机分类。用了两种特征选择方法训练数据库根据用户给出的反馈和减少数据库维度[20]。这种方法提高了性能比较现有特征选择方法。

相关反馈

相关反馈是一种功能强大的技术在FBIR系统中,为了提高……e性能。它允许减少语义低层特征和高层语义之间的差距。相关性反馈背后的想法是将返回的结果最初给定的查询和使用这些结果是否相关的信息来执行一个新的查询[21]。用户反馈给系统基于给定的反馈学习这个概念开始在相关性反馈分为两部分短期学习和长期学习。在长期学习过去的查询和存储和基于过去的结果反馈给结果在短期内学习它不记得过去查询会话。在短期内学习每个会话都有共同的结果独立于以前的结果[18]。
也有查询优化方法有类似像拍摄词学习,是通过查询点移动,更新权向量和概率的方法。Hossein Nezamabadi-pour, Ehsanollah Kabir提出了相关性反馈方案的功能权重更新算法。在该方法的语义网络的图像是由模糊资讯应用方法和相关反馈方法通过图像反馈相关或不相关。基于特征权重调整,用户获得更满意的结果。

相似性度量

FBIR系统相似性度量是重要的一步。特征之间的相似性度量应用查询图像和数据库图像的特征向量。可以找到两幅图像之间的相似性计算它们之间的差异,使图像类似于列表至少距离查询的查询图像或图像。不同的相似性措施将显著影响图像的检索性能。
最受欢迎的相似性度量是欧几里得距离。欧几里得距离是用来衡量两幅图像之间的相似性与n维特征向量[15]。堪培拉距离也用于计算距离。在这个方法中图像索引是基于查询图像和图像之间的距离在数据库中。类似的图像显示在排名顺序[9]。Mahalanobis距离是基于变量之间的相关性,并用于分析各种模式。巴塔查里亚距离措施两个离散或连续概率分布之间的相似性[3]。为比较直方图直方图相交距离测量。计算两个直方图的共同部分,而忽略了功能发生在一个柱状图。

比较不同的技术

本节总结了上述技术中使用的FBIR各种近期的论文。

结论

基于特征的图像检索是用途广泛的学科。根据方法及其结果不同。从上面的研究我们可以说颜色特征提取使用基于HSV空间直方图的方法是更有效的,它需要更少的内存,所以合成数据库会很小。伽柏过滤器将使用纹理特征提取是接近人类视觉表现。形状特征不变矩方法将使用不变的翻译,旋转和规模。这里多个特性将使用而不是单个特征提取方法会给好的结果。
通过使用机器学习算法和相关性反馈我们将努力减少语义鸿沟。从上面的研究我们可以说SVM(支持向量机)有更高的预测能力比较其他监督算法喜欢海军贝叶斯,近邻和树木。使用查询优化方法的相关性反馈系统将用户内涵相关的图片。的系统可以给结果,直到用户不满意的结果。

承认

我非常感激和感谢我的向导和老师的建议,继续支持来完成这篇论文,帮助想以外的东西。

数据乍一看

图1 图2
图1 图2

引用

























全球技术峰会