关键字 |
视觉搜索,循环重新评估、多峰性融合 |
介绍 |
web 2.0技术的随机发展为明显的发展铺平了道路与视觉搜索相关的研究活动。直到这一天,通常商业视觉搜索引擎检索的关键字匹配。同时视觉利用视听内容和用户应用文本文档。利用生动的特性评估的可视化文件搜索引擎是由实用,导致完美的搜索性能。这里的主要目标是实现协议各自的形式以重新排序文件,从而提高检索的精度。两种普通的方法检索可视化模式挖掘[6]和多模态融合[1],[2]。前方法矿山复发模式,无视复杂性的程度,即显式或隐式地从最重要的搜索结果,然后进展的视觉一致文件随机漫步[7]做自我评估通过整理和发现具有相似的文档,在国际米兰加油图像相似性和前期成绩排名。这个方法从未探索多种形式的协作的利用率。而受到不均匀的形式以独立的形式。除此之外,利用形态通常是扎根在定义的应用程序中,从而使采矿过程的概括一个难对付的家伙。 The latter method multimodality fusion recognizes the significance of modalities through fusion weight learning, enabling the reordering of documents through linear combination. Doing the fusion at decision stage. The gaining of the fusion weights estimation is chiefly from the ranking scores in alternative ranked list. |
这里的讨论是基于循环评估,两种模式的算法,利用采矿和多模态融合视觉搜索。值得注意的是,形态互动应该观察到在多个观点隐含复发模式的挖掘和利用各种形式提高搜索性能。 |
圆形的评估 |
循环评估缓解各种形式之间的相互作用,相互强化。这使得强者的强化形态通过沟通模式较弱,而疲弱的形态也受益于强大的模式。国米传输信息的一边到另一边有多个模式就会强烈的表演形态的哲学学习从弱形式,反之亦然。循环评估管理这是一个明确的事实频繁随机循环运行通过轮流排名分数和不同方面。与现有技术相比,评估方法培养之间的交互模式有助于评估找到宁静。 |
最近,多通道融合了很多研究人员的关注,由于利益提供各种多媒体分析流程。多通道融合的混合多个媒体及其相关特性,或中间决策任务进行分析。形态互动矿山循环模式和利用模式提高搜索性能。多媒体分析任务包括多通道数据的事业为了得到重要见解有关数据,情况或更高层次的活动。所有这些媒体完善夹杂物融合在一起的许多分析任务。多个模式使互补信息的融合,提高整体决策技术的准确性。引用是视听的融合特征除了与其他文本信息,导致有效的体育团队视频事件检测,加工时通过一个媒介是不可能的。 |
视觉搜索是一种直观的任务,需要注意,涉及视觉维度的勤奋扫描为一个特定的对象或目标之间的很多对象。这个过程可以真正通过眼球运动或缺乏眼部运动。定位目标的能力在一个复合刺激的模式已经在过去四十年的广泛的研究。实际理由是挑选一个订单生产超市控制台或试图搜索我们的家庭在一个巨大的暴徒。这是一个清单的一些视觉搜索进步人类眼球运动的人类和非人类之间是高度标准化,;有一个复杂的自然场景的视觉启发。 |
相关的工作 |
我们简要地把相关的视觉搜索评估工作分为两组:复发性模式挖掘和多峰性融合。前者假定存在的普遍模式评估的相关文件。后来的预测或学习模式在搜索的重新评估的贡献。 |
.Recurrent模式挖掘 |
复发模式挖掘进行研究在三个不同的维度:自我评估[4],[7],[5],人群评估利用在线人群采购知识[10],以及基于实例评估利用userprovided查询[11],[20]。Fergue et al,[4],采用概率潜在语义分析(向量)挖掘视觉通过聚类类别图像的初始排名列表和扩展查询(如应用于视觉词)包含空间信息翻译和规模不变的方式候选图像然后重新排序基于开采类别之间的距离。自我评估寻求共识从最初的排名列表作为评估视觉模式。许et al,[5],雇用了信息瓶颈(IB)评估找到保存的图像聚类搜索相关性之间的最大互信息和视觉特性。IB评估方法,基于严格的信息瓶颈(IB)原理发现保存的最佳图像聚类之间的最大互信息搜索相关性和高维图像的低层视觉特征在文本搜索结果。在所有可能的聚类的对象在一个固定数量的集群,最优聚类是最小化互信息的损失(MI)和辅助标签之间的特性。级et al,[12],雇用了一个人群评估类似于自我评估除了共识是寻求同时从多个排名列表从互联网获得资源和进一步制定问题随机漫步在一个上下文通过线性融合多模图建立视觉搜索。我们建议使用多通道相似性度量找到最近的邻居的图像。图像的近邻搜索然后局限于这样的一个子空间,即对图像数据库的一个子集。这样我们减少图像的数量对比图建设所需的一个线性量取决于集群大小。 |
刘et al。[10],建议重新评估范式通过发出查询到多个在线搜索引擎。基于视觉词表示,并发和突出的模式都是分别开采来初始化随机图模型基于评估的散步。不同于自我,crowd-re-ranking基于实例评估依赖于几个用户提供的查询示例学习模型。燕et al,[20],雇用了一个分类器被治疗的查询示例学习积极的训练样本,而随机挑选pseudo-negative样本初始排名列表的底部。的分类器捕捉积极和消极的视觉分配样本然后利用评估。刘et al。[11],提出查询的例子是用来识别相关和不相关的视觉概念,它们反过来用来发现任何两个文档之间的等级关系为纠正排名文档对使用互信息。 |
B .Multimodality融合 |
多模融合基于加权线性融合被广泛采用。广泛地说,我们可以将现有的研究自适应[15],和query-class-dependent融合[9]。 |
威尔金斯et al,[18],视频信息检索,提出了一种多模式数据列表中模仿分数的变化来预测模式的重要性。具体来说,逐渐(激烈)变化的分数表明困难(能力)的形态区分相关和不相关的项目,相应的,因此融合权重确定。首先,考试分数的分布可以揭示的结果之间的相关性进行快速初始分数的变化,这些结果,对表现良好的相关性。其次,我们提供了一个初始模型,利用这些相关性和权重自动生成检索系统没有给出这个系统之前任何培训或外部知识的集合。 |
谭et al,[15],提出了融合多种异构数据的agreement-fusion优化模型。杠杆排名从多个列表迭代更新协议开采模式,直到达到一个平衡的重量阶段。分数从多个模式之间的协议是探索指导融合多个图形的线性和自适应的举止。这项协议是利用在两个方面,即个性化分布随机游走,或作为semi-supervised伪训练样本学习适应融合权重不同的模式。调和图融合和协议之间的相互冲突的目标,分两个步骤之间的交换进行迭代达到一个平衡的解决方案。 |
肯尼迪et al,[9],提出了查询类依赖搜索模型在多通道检索查询类的自动发现。该方案首先预定义查询类,然后在离线学习权重类级别上进行查询。在搜索中,一个给定的查询路由到一个预定义的类,和学习权重直接申请融合。这个方案是有效的一般来说当底层查询类可以清楚地定义并有足够的学习样本重量。Query-class-dependent多峰搜索模型通过定义查询类通过聚类过程根据搜索方法的性能和语义特征。 |
魏et al,[16],提出了一个概念多模融合(CDMF),探讨了大量预定义的语义概念计算多模融合权重的小说。在CDMF query-modality关系分解为更容易计算的两个组件:query-concept亲缘和concept-modality相关性。在早期,它可以有效地估计网络通过使用语义和视觉映射技术,而后者可以离线计算基于概念每个形态的检测精度。concept-to-modality关系来确定融合权重,在大量的视觉概念映射和查询。它自动发现有用的查询类的聚类训练集的查询。 |
结论 |
本文讨论的主题是圆形的评估算法。它的规格和相关特性和分类研究人员发起的。这一切是如何开始的进步在图像处理的目的。本文中讨论的各种算法将合适的援助带来有效循环评估技术,图像处理。它超越怀疑他特定的循环评估流程的全面研究将提供一个平台未来的演讲我们会期待它。 |
|
引用 |
- p . k . Atrey m·a·侯赛因a . e . Saddik和m . s . Kankanhalli。“多通道融合多媒体分析:一项调查,”斯普林格多媒体系统。J。,vol. 16, no. 6, pp. 345–379, 2010.
- c . a . Bhatt和m . s . Kankanhalli”艺术的多媒体数据挖掘:状态和挑战,“多媒体工具达成。,51卷,不。1、35 - 76年,2011页。
- k . m . Donald A . f . Smeaton”比较分数,排名和概率融合方法用于视频检索,“在Proc。ACM Int。视频Retr相依之形象。2005年7月,页61 - 70。
- r·费格斯·l·菲菲,p . Perona一起,a . Zisserman“学习对象类别从谷歌图片搜索,“在Proc, IEEE Int。Conf。第一版。粘度,2005年10月,页1816 - 1823。
- w·许l·肯尼迪,S.-F。常,“视频搜索reranking通过信息瓶颈的原则,“在Proc。ACM Int。相依多媒体,2006,pp。35-44。
- w·许l·肯尼迪,S.-F。常,“Reranking视觉搜索的方法,”IEEE多媒体,14卷,没有。3页14-22 Jul.-Sep。2007年。
- w·许l·肯尼迪,S.-F。常,“视频搜索reranking通过随机漫步在文档级上下文图,“在Proc。ACM Int。相依多媒体,2007年,页971 - 980。
- l·肯尼迪、s . f . Chang和a . Natsev Query-adaptive融合多峰搜索,“Proc, IEEE 96卷,没有。4,第588 - 567页,2008年4月。
- l·肯尼迪,a Natsev, s . Chang,“自动发现queryclass-dependent多峰搜索模型,”在Proc。ACM Int。相依多媒体,2005年,页882 - 891。
- t . y . Liu梅,X.-S。华,“CrowdReranking:探索视觉搜索reranking多个搜索引擎,“在Proc。ACM特殊利益
- t·梅,吴x, y . Liu X.-S。华”,优化视频搜索reranking通过最小增量信息丢失,“在Proc。ACM Int.Workshop Retr多媒体正无穷。,2008年,页253 - 259。
- f·里希特,美国伯格、e·霍斯特和r . Lienhart communitydatabases多通道图像搜索排名,“在Proc。ACM SIGMM Int。车间Retr多媒体正无穷。,2010年,页63 - 72。
- f . Smeaton p .结束,w . Kraaij“评价活动和trecvid”在Proc。ACM SIGMM Int。车间Retr多媒体正无穷。,2006年,页321 - 330。
- 通用杖鱼,k·e·a . van de Sande o . de罗阿,b . Huurnink j . c . van Gemert j·r·r·Uijlings j .他x,翻转,诉Nedovic m . van Liempt r·范·Balen燕,m·a . Tahir k . Mikolajczyk j .难应付的m . de Rijke j . m . Geusebroek t . Gevers m .烦恼,a . w . m . Smeulders和d . c . Koelma mediamilltrecvid 2008语义视频搜索引擎,“在Proc。NIST TRECVID车间,2008年,页1 - 14。
- H.-K。谭和C.-W。非政府组织”,融合异构模式的视频和图像评估,“在Proc。ACM Int。多媒体Retr相依。,2011年,p .
- 杨l . m . Wang, X.-S。华,“MSRA-MM:桥接研究和工业社会多媒体信息检索,“微软,华盛顿特区技术。众议员msr - tr - 2009 - 30, 2009。
- X.-Y。魏,Y.-G。江,C.-W。非政府组织”,概念多模融合视频搜索,“IEEE反式。电路系统。视频抛光工艺。,vol. 21, no. 1, pp. 62–73, Jan. 2011.
- p·威尔金斯,t . Adamek g·j·f·琼斯,n . e . O ' connor和a . f . Smeaton“Trecvid 2007 dublincity大学实验”在Proc。NIST Trecvid车间,2007年,页1 - 8。
- p·威尔金斯、p·弗格森和a . f . Smeaton”multimediaretrieval使用分数分布查询时融合”,在Proc。ACM SIGMM Int。车间Retr多媒体正无穷。,2006年,页51-60。
- p·威尔金斯和a . f . Smeaton加权数据融合为基于内容的多媒体信息检索,“在Proc。互联网多媒体搜索最小。2010年1月,1-45页。
- r ., a .豪普特曼,r·金,“多媒体搜索pseudorelevance反馈,”在Proc。ACM Int。视频Retr相依之形象。,2003年,页238 - 247。
- r .严、j·杨和a·豪普特曼”学习query-class依赖权重自动视频检索,“在Proc。ACM Int。相依多媒体,2004年,页548 - 555。
- t .姚明,t·梅,C.-W。非政府组织“Co-reranking相互强化的图片搜索,“在Proc。ACM Int。视频Retr相依之形象。,2010年,页41。
- t .姚明,C.-W。非政府组织和t·梅,“圆reranking视觉搜索”,在Proc, IEEE反式。图像处理,22卷,不。4、2013。
- d .周s . a . Orshanskiy h .咋和c·l·贾尔斯”Co-ranking作者在异构网络和文件,“在Proc, IEEE Int。相依数据挖掘,2007年12月,页739 - 744。
|