所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

网络图像检索与重排序技术综述

B. Steffi图表1——拉梅什2
  1. 印度哥印拜陀Kalaignar Karunanidhi理工学院CSE系PG学者
  2. 印度哥印拜陀Kalaignar Karunanidhi理工学院CSE系助理教授
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际计算机与通信工程创新研究杂志

摘要

网络规模的图像搜索引擎通常使用关键字作为查询,也依赖于邻近的文本来搜索图像。这些搜索引擎由于查询关键字的模糊性而增加了难度,用户仅通过关键字很难正确描述目标图像的视觉内容。图片重排序是一种提高网络图像搜索结果的有效方法,已经被谷歌和Bing等商业搜索引擎实现。图像重排序研究面临的一个主要挑战是,视觉特征的相似性与图像的语义并不能很好地关联起来,从而推断出用户的搜索目标。本文综述了最近开发的用于不同查询的图像重排序技术的各种方法。将每种方法与其他调查方法进行了区分,并给出了各种方法的比较措施,从而说明了针对查询特定语义签名的web图像重排序技术的意义和局限性。

关键字

图片搜索引擎,关键词,图片重排序,语义签名

介绍

图像排序作为一种提高基于Web的图像搜索结果的有效技术,已被现有的工业搜索引擎所实现。对于给定的查询关键字,搜索引擎根据查询重新排列图像组。通过提示用户从组中选择一个特定的图像,其余的图像将根据用户选择的图像重新排名。
网络图像搜索是一个广泛增长的功能,熟悉的搜索引擎,如“谷歌”,“雅虎”,“必应”等。对于一个给定的文本查询,搜索引擎必须搜索数百万张图像,以便尽快检索到相关图像。一般来说,搜索引擎主要是基于使用文本元数据,即关键词、标签和/或接近图像的文本描述。由于元数据并不总是与图像的视觉术语相关联,图像检索通常与不需要的非相关图像分组。尽管如此,已经检查了检索到的图像包含足够的相关图像,这些图像是为用户准备的,这些用户通常更注意到精度而不是回忆。然后对检索到的原始图像进行重新排序,提高检索精度。近年来,在线图像重排名方法减少了用户的努力,使其仅限于一键反馈,这是一种有效的提高搜索结果的方法。这种策略已经被主要的网络图片搜索引擎所采用。其示意图如图1所示。
对于用户给定的查询关键字输入,搜索引擎检索与给定查询关键字相关的图像池。所述检索已针对所存储的字-图像索引文件完成。通常,检索到的图像池的大小是固定的,例如包含1000张图像。从返回的数据池中,需要较短的视觉特征向量和快速的匹配过程,以提高效率。为了达到高效率,视觉特征向量需要很短,匹配速度也要快。一些流行的视觉特征效率高,如果直接匹配尺寸是不能接受的。
下面的文献调查了各种有效的图像搜索和重新排序的网络图像的方法。

网页图像搜索和重新排序方法

用于Web图像搜索的技术:

图像检索中的相关性反馈

Dacheng Tao.et.al在[1]中提出了一套改进CBIR支持向量机射频的新算法。基于内容的图像检索(CBIR)广泛应用基于支持向量机(SVM)的相关反馈方案。随着图像记录的爆炸式增长和计算机能力的快速提高,从庞大的数据库中检索图像是一个具有挑战性的研究领域。这项工作的动机和关键思想来自分类器委员会学习(CCL)。由于每个分类器对相关和不相关类样本的分类能力和性质不同,CCL可以对弱分类器进行分组,提高识别性能。为了提高SVM的性能,本文采用了bagging和随机子空间方法,在常规分类器不稳定的情况下,该方法更有效。

视觉特征与语义特征之间的桥梁

在[2]中,Nikhil Rasiwasia等人提出了一种由视觉实例查询(QBVE)和语义检索(SR)相结合的语义实例查询(QBSE)方法。在语义检索(SR)中,图像通常是根据视觉概念来标记的。然后,每个图像都用一个向量来表征,并将其转化为后验概念概率的语义多项式。检索是通过实例查询假设完成的,其中用户提供了一个查询图像,为此采用了两种机制。首先计算语义多项式,然后将计算结果与数据库中的语义多项式进行匹配。通过可视化示例查询显示了两个主要的有趣属性,一个是实际的,另一个与哲学有关。QBSE构建的检索系统比以前的系统更准确,因为它接管了SR在已知视觉概念空间(称为语义空间)内的泛化能力。从哲学上讲,QBSE促进了实验的目标,清楚地测试语义插图对图像检索的价值,因为它可以在一般查询假设下直接比较视觉和语义演示。

图像搜索的相对属性反馈

在[3]中,Adriana等人提出了一种使用相对属性的图像搜索反馈的新形式。在这种方法中,用户说明范例图像的哪些属性应该被改变,以促进更接近用户对所寻找图像的心理模型。该方法首先在离线模式中学习一组排序方法,其中预测图像中可命名属性的相对强度。查询时,系统先给出一组初步的参考图像,用户从参考图像中选取一张图像进行相对属性反馈。
利用多维属性空间中的约束条件进行相对函数更新和图像池重排序。使用收集到的约束重复此方法,直到排名靠前的图像相对接近用户的目标解决方案。通过这样做,所提出的方法允许用户通过语义语言熟练地“削去”视觉特征空间的不相关部分,从而准确地向系统传达用户的偏好。

通过深度上下文优化搜索结果

Junyang等人在[4]中提出了用于检测大纲的深度上下文方法,该方法细化了搜索结果。该方法将最可能不相关的图像进行排序,认为这些图像是不受现有搜索结果限制的多余信息。为每个图像所呈现的深层上下文收集了一组图像,这些图像通过使用由图像的文本项确定的查询进行搜索检索。可以将该图像在当前搜索结果中的状态与深度上下文进行比较,以验证不相关性得分。随后,将不相关性分数传输到遗漏了有用文本项的图像上。然后通过组合过程建立了两种格式,得到了马尔可夫随机场,并利用图切割方法进行了有效求解。关键在于所提出的方法并不适合于相关图像在顶部结果之间进行视觉组合的假设,而是基于当前查询下的某个异常值可能与其他各种查询下的更流行的异常值相似的检验。

基于无监督语义特征发现的检索

在[5]中,Yin-Hsi Kuo等人提出了一种无监督语义特征发现概念,通过利用社交媒体中的相关文本信息和图像内容来估计两种模式的语义说明,克服了这一困难。所提出的工作采用通用的结构,通过在图像之间使用图形来增强每个图像的相关语义,即文本和视觉特征。该结构以一种无监督的方式在视觉图像和文本图像中通过生成和选择自动确定相关语义特征。该方法在使用不同的优化系统以最大化效率时检查框架的连续性。这可以直接应用于一些应用,如标签细化,图像对象检索和基于关键字的图像搜索。

用于重新排名的技术

1.在线图片搜索重新排名

在[6]中,Jingyu等人提出了基于查询图像的在线图像搜索重排序算法,该算法没有进行在线训练。这项工作提出了自适应相似性,这是由用户在提交查询图像时不断具有详细意图的方案所鼓励的。例如,当用户提交一张中间是全尺寸人脸的图像时,几乎可以肯定用户需要类似人脸的图像。最初,查询图像被划分为众多预定义类别之一。在每个类别中,一个特定的权重模式被发现与适应于这类图像的特征相结合。在使用该图像进行查询时,通过测量查询图像与其相应的相似度度量之间的关联来反映用户的意图,这些类别被称为意图。该方法由rank Boost技术改进而来,通过最小化训练集上每个查询图像的秩损失来关联每个意图类别中的特定权重模式。

2.基于视觉和文本内容的重新排名

在[7]中,Xiaoou等人提出了一种新的基于视觉和文本内容重排序的互联网图像搜索方法。这种技术只需要一键用户反馈。意图权重模式用于统一视觉特征,计算查询图像的视觉自适应相似度。尽管有人工反馈,关键字的视觉和文本扩展被纳入以获得用户意图。扩展的关键字用于扩大正面实例图像,并扩大图像池以容纳其他相关图像。这种结构在商业范围内的图像搜索中具有视觉和文本搜索的前景。所提出的图像重排序结构由几个步骤组成,这些步骤可以独立增强,也可以被其他被认为始终有效的方法所取代。

3.视觉等级

在[8]中,Yushi Jing等人提出了Visual Rank算法,这是一种直接的方法,将网络和链接调查用于Web文档搜索的进展纳入到图像搜索中。视觉排名似乎偏离了使页面排名更成功的关键信息来源:在不同的页面上手工生成的大量链接。另一方面,大量的人工编码信息是由两个系统进行回收的。首先,通过将相关图像与系统中公开的网页相连接,从检索到的答案和人类知识中选择依赖于Visual Rank查询的初始图像集;其次,根据图像之间的一般特征,建立了图像相似度图;那些将共同主题从其他图像中扣留的图像通常具有较高的相关性。

4.监督评估

在[9]中,Linjun Yang和Alan Hanjalic将监督学习假设引入视觉搜索重排序思想,以产生更健壮的重排序系统。该算法既兼顾了有监督的概念相关搜索和无监督的视觉相关搜索重排序的优点,又避免了基于概念的图像搜索的可扩展性问题。为了解决这一问题,该方法定义了一种学习-重排序结构,该结构包含了适应的rank SVM算法和11个轻量级重排序特征,这些特征确定了图像的视觉和文本查询之间的相关性。

5.贝叶斯视觉重排序

在[10]中,Xinmie Tian.et.al提出了贝叶斯视觉重排序,从概率的角度对视觉信息和文本信息进行建模,将视觉重排序作为贝叶斯框架下的优化系统。该方案将文本信息复制为似然,再现基于文本的搜索结果与重新排序的搜索结果之间的差异,即排序距离。视觉信息被复制为一个条件先验,在视觉相似的例子中指出排名分数的一致性,这被称为视觉一致性。贝叶斯视觉重排序方法通过最大化视觉均匀性,最小化排序距离,获得最佳重排序结果。为了更具体地计算排序距离,使用了一种新的成对方法,该方法以成对指令的形式计算关于散度的排序距离。在视觉一致性方面,研究了三种不同的正则化方法,以提取其建模的最佳方法。

结论

目前的调查提出了各种方法用于图像搜索和重新排序的网络规模的图像。每种调查方法在图像检索过程和图像排序方面都有显著的效率。本文从各个方面论述了每种方法的优缺点。测量方法的效率可以从检索精度和计算时间两方面来衡量。综合考虑每种方法的优点,进一步增强这些技术在大规模网络图像搜索和重排序机制中的有效性。

数字一览

图1
图1

参考文献











全球科技峰会