基于上下文依赖的标志匹配识别系统综述

骨。Prachi Jivan Dikey
印度马哈拉施特拉邦Amravati GHRCEM EXTC系学生

摘要

在本文中，我们提出了一个图像和视频中的标志检索框架。来自Flickr、YouTube等公司、机构、个人和社会系统的可视化数据的广泛应用是为了传播和分享图像和视频。在处理被噪声损坏或受到任何变换的图像的视觉数据时，存在几个问题，并且其匹配logo的准确性是目前正在出现的一些研究问题。为了克服这些问题，我们提出了一种新的基于上下文依赖的相似度分类算法，该算法提高了标识匹配的准确性和计算时间。本文提出了在品牌广告和监控应用中具有重要意义的标志匹配与识别的设计。它可以发现标识的不当使用或未经授权的使用。参考标志和测试图像被视为局部特征(兴趣点、区域等)的星座，并通过最小化能量函数混合进行匹配:1)测量特征匹配质量的保真项2)捕获特征共现/几何形状的邻域准则3)控制匹配解决方案平滑度的正则化项。上下文是兴趣点的集合，通过创建上下文相关相似矩阵来寻找两幅图像之间的兴趣点对应关系，从而实现logo检测。

关键字

标识匹配，标识识别，内容相关的相似性，标识图像，上下文准确性

介绍

标识——我们每天都能看到几百个。我们经常看到它们，甚至不去想它们。但是，即使是最简单的标志，也要花费数年的工作和数百万美元，有时隐藏的含义会让人难以置信。从图像中检索Logo是一个具有潜在广泛商业应用的挑战性问题。这类应用大多要求对标志图像进行实时索引和高精度检索。图形标志是一类特殊的视觉对象，对于评估某物或某人的身份极其重要。在工业和商业中，它们在唤起顾客对特定产品或服务的期望方面起着重要作用。这种经济相关性促使公司积极参与征求智能图像分析解决方案，扫描标识档案，寻找类似的已有标识的证据，发现不当或未经授权使用其标识，揭示恶意使用与原件相比有微小变化的标识以欺骗客户，分析视频以获得关于其标识显示时间的统计数据。

logo是一种图形产品，可以让人想起一些现实世界中的物体，或者强调一个名字，或者只是展示一些具有强烈感性吸引力的抽象标志(见图1(a))。该方法采用基于上下文的相似度算法，对测试图像进行预处理，提取兴趣点，进行上下文计算和相似度设计。该方法克服了对含有logo的不清晰或损坏的图像进行处理并检测其真伪的局限性。不同的标志可能具有相似的布局，但图形元素的空间配置略有不同，方向、大小和形状的局部差异，或者在恶意篡改的情况下，由于一个或几个特征的存在或不存在而有所不同。

在现实环境中拍摄的图像中进行标识检测和识别的通用系统必须符合对比要求。一方面，需要对大范围的几何和光度变换保持不变，以符合图像或视频录制的所有可能条件。由于在真实世界的图像中徽标不是孤立地捕获的，徽标检测和识别也应该对部分遮挡具有鲁棒性。

相关工作

目前logo检测与识别的工作主要是为logo注册过程提供一些自动支持。系统检查数百万个已注册的logo档案中，是否存在与即将发布的新logo形象相似的外观，以确保其具有足够的独特性，避免混淆[3]，[7]。加藤的[9]系统是最早的系统之一。该方法将一个标准化的标志图像转换为一个64像素的网格，并根据边缘像素的频率分布计算出一个全局特征向量。最近，Wei et al.[10]提出了一种不同的解决方案，用全局泽尼克矩、局部曲率和到质心的距离来描述标识。其他方法使用了完整标识图像的不同全局描述符，或者用于标识轮廓，或者利用形状描述符(如形状上下文)。该方法假定一个标志图片在图像中是完全可见的，没有被噪声破坏，也没有受到变换。据此，它们不能应用于真实世界的图像。Hichem Sahbi, Lamberto Ballan，在他们的论文中，他们通过在具有挑战性的MICC-Logos数据集上进行大量实验，展示了该方法的有效性。该方法超过了20%的基线以及最先进的匹配/识别程序。[11]。Sami M. Halawani1 and Ibrahim A. Albidewi in their research work concerned with the specific class of complicated objects, i.e. logo. The progress, particularly in this field, is still at extensive research work level, due to infinite varieties of shapes and classes which are used. Essentially, the algorithm proposed is based on Principle Component Analysis (PCA) approach. In this technique, the PCA is used to extract the features, kept inherent in the normalized pattern for later matching process. The experiment had shown that, the minimum number of weights needed to perform a correct recognition is seventeen. However, for the purpose of image reconstruction, this number is not enough to build a visible image [12].

Suma R1, Anita George在他们的工作中介绍了一种方法，这是一种新型的标志检测和定位方法，基于一种新的相似类，称为上下文依赖。所提出的方法的优点在于几个方面:(i)在相似设计和视觉特征中包含关于空间配置的信息，(ii)通过我们的能量函数控制上下文的影响和解决方案的正则化的能力，(iii)对不同方面的容忍度，包括部分遮挡，使其适合检测接近重复的标志以及外观上有一些变化的标志[13]. j。Matas等人介绍了一种新型旋转不变量检测器。它被称为SURF。提出了一种新的建立暂定对应关系的鲁棒相似度量方法。鲁棒性确保了来自多个测量区域(由外部区域的不变构造获得的区域)的不变量，其中一些显著大于mser[6]。朱光宇:Doermann D.在他们的工作中针对图形检测和识别是文献图像分析和检索的基础研究问题。在这项工作中，他们开发了一个基于标识的自动文档图像检索系统，该系统通过在多个图像[9]上增强级联分类器来处理标识检测和分割。David S. Doermann, Ehud Rivlin和Isaac Weiss在他们的工作中，提出了一种多级分阶段的徽标识别方法，该方法使用全局不变量来修剪数据库，使用局部精细不变量来获得更精细的匹配。它们获得一个不变签名，可用于各种转换下的匹配。他们的工作提供了一种计算欧几里得不变量的方法，并展示了如何在必要时扩展它们以捕获相似度，一个精细的投影不变量。 They implement feature detection, feature extraction and local invara'ant algorithms and successfully demonstrate the approach on a small database[6].

须P.Bridoux C。卡摩尔,B。在他们的研究工作中，提出了在标识和单词识别领域的工作。该方法基于信号配准的一般理论，因此适用于广泛的信号处理领域。该算法已成功地应用于语音识别、手写识别以及文档分析等领域。Shamini1, Dr.N.Jaisankar提出了一种基于改进上下文相关算法的新的相似类。他们实现了缩放不变特征变换算法进行关键点提取和增强的上下文计算技术，提高了标识匹配精度和计算时间[14]。Smeulders, Worring . m Santin, S.Gupta, A.jain提出了200篇基于内容的图像检索文献的综述。这项工作从讨论基于内容的检索的工作条件开始:使用模式、图片类型、语义的作用和感觉差距。后续章节讨论图像检索系统的计算步骤。回顾的第一步是根据颜色、纹理和局部几何进行检索的图像处理。接下来讨论检索的特征，按:累积和全局特征、突出点、对象和形状特征、符号及其结构组合进行排序。 Similarity of pictures and objects in pictures is reviewed for each of the feature types, in close connection to the types and means of feedback the user of the systems is capable of giving by interaction [2].Neumann et al. [4] uses projection profiles, normalized centroid distance, eccentricity, and various density features for logo recognition. These approaches have limitations. First, it is difficult to robustly extract high-level features (e.g. graphical, inverse, or circular text) in a geometrically invariant manner under diverse image qualities and degradations. Second, these methods are hard to extend because they are based on a collection of handpicked and trainable features and a variety of decision rules.D.Lowe et al , Proposed Distinctive invariant method which is used for feature extraction. Object recognition is done from nearest neighbor algorithm it also describes an approach to using these features for object recognition. The recognition proceeds by matching individual features to a database of features from known objects using a fast nearest-neighbor algorithm followed by a Hough transform [5].Wei-Qi Yan · Jun Wang · Mohan S. Kankanhalli presented the use of the temporal correlation of video frames to detect and remove video logos. In the video-logo-detection part, as an initial step, the logo boundary box is first located by using a distance threshold of video frames and is further refined by employing a comparison of edge lengths.[15]

上下文相关的相似

本文提出了一种基于“上下文依赖相似度”(CDS)内核的logo检测与识别新方案，该内核直接融合了局部的空间上下文。令SX = {x1……xn}， SY = {y1，…， ym}分别是从参考logo和测试图像中提取的兴趣点列表(n, m的值可能随SX, SY而变化)。

使用上下文进行匹配:上下文用于查找两个图像之间的兴趣点对应关系，以解决徽标检测问题，而有时上下文用于内核设计，以便使用支持向量机处理对象分类。

设计模型的更新:定义邻接矩阵是为了对属于两个图像(一个参考标志和一个测试图像)的兴趣点之间的空间和几何关系(上下文)建模。这些邻接矩阵模拟了不同方向和位置的兴趣点之间的相互作用，从而形成了一个各向异性的上下文。

相似扩散过程:由于上下文的定义，兴趣点之间的相似性是递归的，各向异性的扩散。

模型解释:设计的相似性可以解释为联合分布(pdf)，它模拟了从SX × SY中获得的两个兴趣点匹配的概率。为了保证这种相似性实际上是一个pdf，我们使用配分函数作为SX × SY中所有兴趣点的归一化因子。

该方法

图像匹配是计算机视觉中许多问题的一个基本方面，包括物体或场景识别，从多幅图像中求解三维结构，立体对应和运动跟踪。基于上下文的相似度算法流程图如图2所示。

该方法提出了一种基于上下文相关相似矩阵的标志匹配方案。将有标志图像作为参考图像和视频测试的标志的整体性。从测试视频中提取视频帧。提取参考图像的上下文和视频中的所有帧。完成了视频帧与参考图像的匹配。SIFT特征对图像缩放和旋转具有不变性，对光照和三维摄像机视点的变化具有部分不变性，该方法通过将标志图像分为行和列来进行匹配。当这个过程完成后，匹配将非常准确。实验结果表明，该方法能够有效地满足现实世界图像中标识检测和识别的要求。匹配和检测成功的概率高。

系统设计

系统模块包括:

•预处理

•特征提取

•兴趣点识别

•标识匹配

预处理

预处理包括对图像进行几何和辐射校正、增强或标准化的过程，以提高我们定性和定量解释图像组件的能力。预处理是图像处理前滤波噪声和增强图像的一项重要技术

•辐射增强:应用辐射校正的主要目的是减少图像亮度值中错误或不一致的影响。

•空间增强:用于提高视觉质量分析特性和提取生物物理/景观参数。

对比度增强:对比度增强用于使看起来黑暗或朦胧的图像变亮。用于提供具有最佳质量和清晰度的图像。

特征提取

•颜色:计算图像中颜色的百分比。

•文本:找到一个独特的底层纹理特征。

边缘:边缘对应于图像中较大的不连续。

兴趣点识别

两个或多个边段之间的交点。考虑了兴趣点的背景和方向。Context指的是二维空间坐标，Orientation指的是兴趣点的角度。兴趣点识别是基于标志图像的边缘和曲率。

标志匹配

在两个logo图像中独立检测相同的特征点。对应点的可靠匹配。本地化用于查找点的确切位置。

类似地，对视频进行匹配和识别过程的计算。如图3所示，在输入视频片段后，我们利用基于帧差的方法和先验知识，借助logo数据库检测视频logo，检测出视频logo。

在得到视频logo的矩形区域后，对其进行细化，得到logo轮廓。一旦获得精确的标志区域，我们使用基于匹配的重叠技术或视频修补技术来删除标志。例如，基于帧差计算的logo检测能够检测到运动帧上的logo，但无法检测到静态帧上的logo。为了在真实的静态条件下检测logo，我们使用了一个logo数据库，以便使用贝叶斯方法来搜索它们。为了提高检测的准确性，我们假设logo出现在视频帧的四个角的概率比出现在中心的概率高。我们将这种先验知识与基于神经网络的局部特征分类器结合起来。使用两种方法从视频帧中擦除logo的主要原因是，如果logo区域的运动不足以暴露下面的区域，基于匹配的重叠方法的结果并不令人满意。另一个原因是，如果logo区域太大，重叠将导致视频区域的可观察边缘。因此，视频修补方法为标识擦除提供了一种有效的替代方案。

未来的范围

这项工作的进一步扩展包括将该方法应用于视频和图像中的标志检索，以更高的精度，以及对上下文定义的改进，以处理其他刚性和非刚性标志转换。

结论

一种新的标志检测和定位方法被引入了一类新的相似点，称为上下文依赖。如今，标识匹配对于检测标识的非授权使用非常重要。Logo检测过去只在高质量的图像中进行。但使用该方法，也可以检测到部分遮挡的标志，识别精度也较高。

鸣谢

我非常感谢我的导游N.N. Mandaogade在整个工作过程中一直给予我的支持和鼓励。

数字一览


图1一个	图1 b	图1 c	图2	图3

参考文献

Suda p.，Bridoux C. Kammerer B.，Maderlechner G.，“标识和单词匹配的一般方法的信号配准文件分析和识别”，1997。

Smeulders, M. Worring, S. Santini, A. Gupta和R. Jain，“早期基于内容的图像检索”，IEEE Trans。模式肛门。马赫。智能。，vol. 22, no. 12, pp. 1349–1380, Dec. 2000.

J.-L。Shih和l - h。陈，“一种新的商标分割与检索系统”，图像可视化计算。，第19卷，no。13, pp. 1011-1018, 2001。

J.诺伊曼，H.萨梅特，A.索弗。，“将局部和全局形状分析集成到标志分类中。光子学报，23(12):1449-1457,2002。

《基于尺度不变关键点的图像特征的区分》。第一版。见，第60卷第2期，第91-110页，2004。

Matas J.和Chum O.，“来自最大稳定极值区域的鲁棒宽基线立体”，图像与计算。《中国科学》，2004年第22卷第10期，第761-767页。

J. Schietse, J. P. Eakins, R. C. Veltkamp，“商标图像检索的实践与挑战”，载于《ACM期刊》。图像视频回放。，Amsterdam, The Netherlands,pp. 518–524,2007.

David S. Doermann, Ehud Rivlin和Isaac Weiss，“使用几何不变量的标识识别”，文档处理组，马里兰大学自动化研究中心，学院公园，2007年。

朱光y,Doermann D，“文档图像检索和文档分析与识别的标志匹配”，ICDAR ' 09，第10届国际会议DOI:10.11.09 ICDAR 2009。

学术界。魏勇，李勇，魏勇。Chau和c - t。李，“利用合成特征描述整体形状和内部结构的商标图像检索”，模式识别。，第42卷，no。3, pp. 386-394, 2009。

Sahbi H.和Ballan L，“基于上下文的Logo匹配和识别”，成员，IEEE, Giuseppe Serra，和Alberto Del Bimbo，成员，IEEE, 2013。

Sami M. Halawani1, Ibrahim A. Albidewi2，“基于主成分分析的标识匹配技术”，国际视频图像处理与网络安全杂志ijvipnn - ijens Vol:10 No:03 20 '。

Suma R1, Anita George2，“基于上下文依赖相似度的视频应用中的鲁棒标识匹配和识别”，国际新兴技术与先进工程杂志”。

S.Shamini1 Dr.N。Jaisankar，“改进的logo匹配和识别的上下文依赖相似算法”，Elysium杂志

王伟奇亚军·莫汉S.坎坎哈利自动，“视频标识检测及修订版”:Springer-Verlag 2005。