关键字 |
精明的边缘检测;矩不变量;最近邻;神经网络;目标识别;主成分分析。 |
介绍 |
目标识别是计算机视觉中的一个基本问题。识别二维对象从一个图像是一个众所周知的。大多数研究人员认为认识到对象的特征信息在当地或全球。只有少数评估两个对象的局部和全局特征识别。基于特征用于识别,特征提取方法可以大致分为两类:本地方法和全局方法。对象识别,这是一个简单的任务对于人类观察者,一直是许多研究的重点在计算机视觉中,作为许多基于机器的目标识别系统的重要组成部分。大量的文献中提出了不同的方法。对象识别的问题是确定,如果有的话,一个给定的一组对象的出现在一个给定的图像。因此对象识别匹配的问题模型与表示的模型从数据库提取测试图像。本文给定的彩色图像预处理和图像转换成gery-scale。 The grey-scale image is used for the object recognition process. First Canny Edge Detection Method is applied to detect the edges. From the edged detected image the Geometric moment invariant is computed along with the dimension of the object and the center of the object. These computed values constitute the feature vector. The feature vector is applied Principal Component Analysis to reduce the dimensionality of the data and to produce the eigenvalue of the image. During the training phase the above process is performed and the eigenvalue along with the tag is stored in the database. During the testing phase for the given image the eigenvalue is computed and compared with the value retrieved from the database. Based on the result, a rotation and scaling invariant function is constructed to achieve a set of completely invariant descriptors. A k-nearest neighbors classifier is employed to implement classification[18]. |
理论和实验结果表明这种方法的优越性与正交基于当下的分析方法。也证明效率再Fuzzy-k最近邻和反向传播网络用于分类。从结果,结果表明,再比别人表现良好。 |
剩下的纸是组织如下。第三部分介绍了该方法的总体框架,它由精明的边缘检测,几何的时刻和不变量。在第四部分讨论特征值计算。第四节之后,第五部分描述了分类器和神经网络用于识别目的。第六部分提供了实验结果和第七部分总结了纸。 |
相关工作 |
J。高,表明最近邻分类的模式是最好的方法。罗胡安和Oubong Gwun表明PCA-SIFT扮演重要的角色在提取图像变形的最佳特性。丽丽,证明了资讯更容易和简单的建立一个自动分类器。艾哈迈德,州筛选的重要性在物体识别要点。Ananthashayana V。K和亚莎。V发现PCA和IPCA在特征提取过程中扮演着至关重要的作用。Te-Hsiu出版社。,proposes the use of eigenvalues of covariance matrix, resampling and autocorrelation transformation to extract unique features from boundary information and then use Minimum Euclidean distance method and back propagation neural networks for classification. S. Dudani et.al, shows that moment invariants plays vital role in aircraft identification. |
提出工作 |
拟议的框架包括两个阶段我)训练阶段和ii)测试阶段。在训练阶段的图像子集线圈- 100是作为系统的输入。在预处理阶段的边缘检测图像中精明的边缘检测,然后使用几何矩不变量和对象的尺寸计算。计算机信息形成特征向量。特征向量的维数降低使用主成分分析,计算图像的特征值。计算特征值存储在数据库中,标记指定对象。在测试阶段,该系统,给出了一个图像边缘检测和边缘检测图像特征向量构造使用矩不变量和对象的尺寸。为新的特征向量特征值计算。再,模糊knearest邻居和反向传播网络用于识别对象。 |
答:精明的边缘检测: |
精明的边缘检测[19]使用线性过滤高斯内核来平滑噪声,然后计算每个像素的边缘强度和方向平滑的图像。这是通过微分图像在两个正交的方向和计算梯度大小作为根平方和的衍生品。梯度方向是计算使用衍生品的比例参数的反正切值。候选人边缘像素的像素被确定为在稀释过程称为非最大抑制。在这个过程中,每个候选边缘像素的边缘强度设置为0,如果其边缘强度并不比边缘强度两个相邻像素的梯度方向。然后做图像变薄边缘级阈值使用滞后。在滞后,两个边缘强度阈值。所有候选边缘像素低于低阈值贴上non-edges和以上所有像素低阈值,可以连接到任何像素高阈值以上通过一连串的边缘像素标记为边缘像素。 |
b .矩不变量: |
矩不变量用于许多模式识别应用程序。使用时刻在形状识别的想法获得了1961年,当胡锦涛派生的矩不变量使用代数不变量理论[6]。图像或形状特征不变量保持不变,如果图像或形状进行以下更改我的任意组合)的变化大小(规模)ii)改变位置(翻译)iii)改变方向(旋转)iv)反射。 |
矩不变量是非常有用的从二维图像中提取特征的方法。矩不变量的属性连接地区二进制图像不变的翻译、旋转和规模[3]。The 标准化 中心 时刻 (1), 用 pq 被 定义 为 |
|
c .正交时刻: |
自胡锦涛介绍了矩不变量,时刻和力矩函数被广泛应用于图像处理领域。进一步研究所得的引入一组正交的时刻(例如勒让德时刻和泽尼克),在正交时刻可以用来表示图像的最低数量的信息冗余。勒让德时刻被用在许多应用,如模式识别、人脸识别、直线拟合。勒让德时刻仅仅被使用,因为它是高度复杂的计算和成本在高阶的时刻。这些正交时刻需要低精度的优势代表了单项差异相同的精度。原来函数的正交性条件简化了重建从生成的时刻。 |
特征值和主成分分析 |
在线性代数中,特征向量线性算子的非零向量,当由操作员操作,导致其中一个标量。然后称为标量特征值与特征向量相关(λ)(X)特征向量是一个向量扩展的一个线性变换。它是一个矩阵的属性。当一个矩阵作用于它,只有向量大小改变而不是方向。 |
|
在侦破()表示行列式。当评估一个多项式的学位n。这就是所谓的特征方程,和相应的多项式。学位的特征多项式是n。如果是n x n,还有n解决方案或特征多项式的根。因此有n满足方程的特征值, |
|
分类器 |
再在模式识别,算法(事例)是一种基于最近的训练例子分类对象的方法在特征空间中。再邻居算法中最简单的机器学习算法:一个对象分类的多数票邻国(k是一个正整数,通常是小的)。如果k = 1,对象只是分配给类的最近邻。或许是最简单的最近邻法相结合的算法预测的一个测试的例子。训练阶段是简单,ie。,to store every training example, with its label. To make a prediction for a test example, first compute its distance to every training example. Then, keep the k closest training examples, where k ≥ 1 is a fixed integer. This basic method is called the k-NN algorithm. For example k=3. when each example is a fixed-length vector of real numbers, the most common distance function is Euclidean distance |
|
x和y是在R点在哪里米。 |
答:再 |
再算法(资讯)是使用监督学习的一部分,在许多应用领域的数据挖掘,统计模式识别和许多其他人。资讯分类对象的一个方法是基于最近的训练示例特征向量。对象分类的多数票邻国[11]。K总是一个正整数。邻居们从一组对象的正确分类。通常是使用欧氏距离,虽然其他距离等措施可以使用曼哈顿距离。再计算邻居的算法如下: |
1。首先确定参数K =数量的最近的邻居。 |
2。计算查询实例,所有的训练样本之间的距离。距离估计,采用欧氏距离法。 |
3所示。所有训练样本的距离,确定基于k最近邻的最小距离。 |
4所示。把所有训练数据的类别的排序值属于K。 |
5。使用的大多数最近的邻居的预测价值。 |
b .反向传播神经网络 |
反向传播神经网络(症)由至少三层单位:一个输入层、至少一个中间隐层和输出层为Fig.。通常情况下,单位连接在前馈方式输入单位完全连接到单位在隐藏层和隐藏的单位完全连接在输出层单元[9] |
使用bp神经网络在这个研究的目的是采用记忆的特点和引用属性识别测试2 d图像特性[4]。网络的输入从图像中提取的特征信息。和目标对象的指定索引。当训练以外,输入模式(x1, x2)是美联储到网络,通过隐层到输出层。输出模式比较与目标模式发现偏差。这些提取特性不断送入症和网络将selfadjust直到一组权重(V11, V12 V21, V22)与指定的错误值。然后这些权重存储,用于识别。 |
c .模糊再(事例)分类器 |
模糊的事例,提出了利用模糊集合理论解决分类问题。这个方法分配类会员输入模式x,而不是一个特定的类的事例。在模糊事例结果是每个班级成员信息(x)。利用模糊集理论的优点是没有任意分配。此外,成员的值输入模式将提供一定程度的保证分类结果。 |
实验结果 |
该方法使用c#实现的。净与奔腾IV 2.40 GHz,个人电脑1 GB DDR内存。培训/测试、数据库的子集线圈- 100[14]使用的图像,它包含大约7200图像中大约100不同种类的对象。实验方法的选择36个对象类。一些对象类瓶,汽车,玩具,杯子,可以和西红柿等,如Fig. c所示。结果是约2000 560训练图像和测试图像,其中大部分是128 x 128像素大小。实验测试该方法的识别精度。第二个目标是验证了该方法的鲁棒性。性能比较该方法与正交时刻泽尼克和勒让德为基础,也与反向传播网络和模糊再网络。 |
下面Fig.拟议的框架系统,图像预处理如下。首先给定的彩色图像转化为灰度图像。为了减少计算量,而不考虑整个图像,边缘检测操作执行来获取图像的边缘。边缘检测,该方法使用的是精明的边缘检测方法。一旦检测到图像边缘图像转换过程应用于反图像。之后,合成图像用于特征提取的过程。首先,胡锦涛的七个不变矩计算使用(2)(8),物体的尺寸和中心的图像计算如下。为了得到的尺寸形状,边缘检测的垂直和水平投影图像应用。首先通过计算执行水平投影的边缘检测图像的像素总数每一行。行最大数量的像素被记录。 Then, beginning at this row, upper and lower rows were sought. The first upper row with a projected value smaller than a threshold was marked as the top of the edge of the object in the image, and the first lower row with a projected value smaller then a threshold value was marked as the bottom boundary of the object in the image. The horizontal projection provides the height of the object in the image. The same technique was then used on vertical projection to find the width of the object in the image. Using the values obtained in the vertical projection and horizontal projection it is easier to find the center of the object. Also the center of the image is obtained using moment invariant computation. Both the values are used for feature vector formation. |
计算特征向量处理来确定图像的特征值并存储在数据库在训练阶段。在测试阶段,重复同样的过程和测试图像的计算特征值与特征值从数据库检索。再分类器识别对象,确定正确的指数;实际上属于测试图像。 |
训练反向传播神经网络和计算正确的重量,一个特征向量计算提供的训练图像集作为输入向量。目标模式是对象的索引和标签对象。一旦网络被训练,测试图像特征矢量输入层。BP神经网络能正确识别图像。以同样的方式模糊再她面前实现与培训/测试图像。使用相似的价值观,反向传播神经网络,然后再分类器确定类的新形象。 |
线圈- 100 a .结果数据库 |
从数据库线圈- 100、36对象选择培训和测试一些对象的示例视图所示Fig. b。该数据库上进行的实验是由不同的训练样本数量97%置信区间。这个结果表和Fig. c所示。再可以看出算法相比表现良好的识别率反向传播神经网络和模糊再分类器。从表中b和Fig. d .该不变矩特征提取方法以及中心的对象和对象的尺寸使用特征值提供了更好的特性向量相比其他正交的时刻和不变矩的方法。从上面的结果该方法使用特征值识别对象分类器的帮助下再提供有效的和更高的精度。 |
结论和未来的工作 |
本文结果表明,该方法再使用特征值计算的局部和全局特征图像,有效地识别对象从一个图像相比症和模糊再邻居的方法。也该方法结合了局部和全局特征的特征向量。这些实验是进行该方法和传统的方法。总体而言,可以看出该方法表现明显优于传统算法,使用矩不变量/正交的时刻。 |
本文提供的识别精度演示了局部和全局特征相结合的电力使用特征值。也预计,该方法可能适用于各种应用程序像计算机启用视觉部分失明,监测系统,自动视觉检查和鱼类分类。该方法的局限性之一是单一对象的识别给定的图像。我们未来的工作将集中在使用多个对象识别。 |
表乍一看 |
|
|
表一个 |
表b |
|
|
数据乍一看 |
|
|
引用 |
- 艾哈迈德·法瓦兹。Otoom Hatice枪,马西莫·Piccardi”被遗弃的对象分类特征提取技术在视频监控中,“IEEE国际会议上图像处理的程序,1368 - 1371年,2008页。
- Ananthashayana V。K和亚莎。V,“外貌的3 d对象识别使用IPCA-ICA,”国际摄影测量的档案,遥感与空间信息科学。卷,37章。一部分B1。北京,1083 - 1089年,2008页。
- s . Dudani k繁殖,r . McGhee“飞机识别的不变矩,IEEE计算机Vol.26, 1号,39 - 45,1977页。
- R Feraud,阿伯尼尔,j . e . Viallet M Collobert,“基于神经网络的快速、准确的人脸检测器,“IEEE模式分析与机器智能卷。23日,1号,42 -53年,2001页。
- j .高z谢,吴x”通用对象识别与区域统计模型和层共同提高,“模式识别字母,28卷,没有。16,2227 - 2237年,2007页。
- 胡表示抗议,视觉模式识别的不变矩,愤怒交易信息理论8,179 - 187年,1962页。
- Te-Hsiu阳光、刘Chi-Shuan Fang-Chih天山”不变的二维目标识别使用协方差矩阵的特征值,重采样和自相关,”专家系统和应用程序,vol.35, 1966 - 1977年,2008页。
- J.E.杰克逊,用户指南的主要组件,约翰·威利& Sons:纽约,1991年。
- k . h . Kim Nam”,对象识别one-DOF工具的反向传播神经网络,“IEEE事务在神经网络下册,2号,第487 - 484页,1995年。
- 库恩悦,世界唯一刘和李平周”,自动从文件中提取关键字基于多个基于内容的措施”,国际计算机系统科学与工程学报,26卷,2号,2011年3月。
- 李丽丽,张YanXia赵永恒,“再邻居天体的自动分类,“科学在中国系列Mech G-Phys阿斯特朗,Vol.51,不。7,916 - 922年,2008页。
- 罗胡安和Oubong Gwun”的比较筛选,PCA-SFIT和冲浪,”国际期刊》的图像处理,第三卷。Issue.4。,pp。
- K。Mikolajczyk和C。施密德,”一个绩效评估当地的描述符,“IEEE模式分析与机器智能,27卷,没有。10日,1615 - 1630年,2005页。
- 年代。Nene, s·纳亚尔h . Murase哥伦比亚对象图像库(线圈- 100):技术报告,cuc - 006 - 96, 1996。
- K。大庭,k . Ikeuchi检测能力、惟一性和可靠性的特征windows验证部分阻挡物体稳定,“IEEE模式分析与机器智能Vol.19, 9, 1043 - 1048年,1997页。
- 马Xiaowu Chen Yongtao Qinping赵,“多媒体网络对象提取基于关系模式”,国际计算机系统科学与工程学报,25卷,6号,2010年11月。
- j .张x张h .克里米亚G.G.沃尔特,”在塑造空间对象表示和识别,”模式识别、36卷,第1154 - 1143页,2003年。
- 玄王,本小、建峰Ma和Xiu-Li Bi。“缩放和旋转不变的分析对象识别方法基于氡和Fourier-Mellin转换”Recogn.Vol模式。40岁,12路,pp.3503 - 3508, 2007。
- 持续音Daggu Venkateshwar Rao,帕蒂尔,纳文·安妮先生和V Muthukumar“图像处理算法的实现和评价使用基于c的硬件可重构体系结构描述语言”国际理论和应用计算机科学杂志》,第一卷。1,9-34,2006页。
- 来自,r和c . Chandrasekar 3 d对象识别使用多类支持向量machine-k-nearest邻居支持本地和全局特性。《计算机Scince Vol.8,八号,pp.1380 - 1388, 2012。
|