关键字 |
人脸识别、修改局部二进制模式,多层前馈神经Netwrok,反向传播学习规则。 |
介绍 |
许多生物识别方法提出了个人识别在过去。在基于视觉的,我们可以提到人脸识别,指纹识别,虹膜扫描和视网膜扫描[1 - 4]。人脸识别是基于视觉中最广为人知的。脸是一种行为生物;它是基于物理特性的一个独立的个体。像这样的人的脸可能随着时间而改变,但仍是独一无二的,很难建立的模式。面对社会生活主要关注的焦点。扮演一个重要角色在传达身份和情感。人类面孔辨识能力是惊人的,但它很难识别面临的特定类型的人都是相似的。太监是特殊类型的人解决各种名称:逃亡,kinnar,变性人,第三性别、或其他性。太监住在他们自己的社区——一个独立的世界。 Among these ostracized eunuchs, many of them are castrated, few are genetically born hermaphrodite, that is, they have genitals of both sexes, and few are transvestites that is, a female mind trapped in male body or vice versa [5]. Transgender communities have existed in most parts of the world with their own local identities, customs and rituals. As of date now face recognition done on either male or female faces but Eunuch faces are different in dimension as their faces are different from normal human being.Face recognition problem is concerned to determine whether a particular face belongs to a person, to decide if the record regarding the concerned person already exists or not. Computer recognition of face images involves two important aspects: facial feature extraction and classification. Before extracting features it is necessary to derive a set of features from original image that are to be used for describing faces. Features may or may not relate to intuitive notation such as eyes, nose, lips, and hair etc. If features used for recognition are not passable, even the best classifier will fail to achieve accurate recognition. Hence it requires extensive knowledge to select adequate feature that describe face. Adequate facial features are desired to have following properties [6-7]: first, they should be able to tolerate the within-class variations while discriminate different classes well; second, they can be easily extracted from the raw images to allow fast processing; and finally, the features should lie in a space with the low dimensionality in order to avoid computationally expensive classifiers.A number of studies based on various algorithms has been reported since long on face recognition. M.Turk et al proposed Principal Component Analysis [8] approach for automated face recognition aimed at to catch the total variation in the set of training faces and to explain the variation by a few variables. Linear Discriminant Analysis (LDA) [9], and Independent Component Analysis (ICA)[10] have been widely used for feature extraction and object recognition.Although these studies were made for the recognition of general human faces, no work on Eunuch Face Recognition using combination of various algorithm is found in available published or on time literature. Face recognition system generally includes a series of steps as follows: (i) image acquisition, (ii) face pre processing including localization, segmentation, and normalization (iii) feature extraction, and (iv) matching and classification, as shown in figure 1. Image acquisition is the first step in Eunuch Face Recognition System where a face image is captured, and the second step is pre processing and it includes localization, segmentation and normalization. The third step is the feature extraction to get the feature vector and Classifier used for matching and classification to obtain the recognition rate.This paper is organized as follows: Local Binary Pattern (LBP) and its variants are described in section 2. Proposed modified algorithm over LBP and feature extraction technique has been discussed in sectin 3. Section 4 has dealt with the application of proposed algorithm in order to classify the extracted features. Experimental results and discussion are given in section 5. Conclusion is incorporated in section 6. |
局部二进制模式方法:简要回顾 |
局部二进制模式(LBP)是一种有效的方法用于特征提取和纹理分类[11]。在本节中,我们介绍了原始LBP算子以及一些扩展,如多尺度枸杞多糖、枸杞多糖和变异扩展枸杞多糖和人口普查枸杞多糖 |
答:最初的枸杞多糖 |
最初的局部二进制模式(LBP)操作符是一个非参数3 x3社区运营商,总结了图像的局部空间结构。首次引入了Ojala等。[12]显示高辨别力的这个操作符的纹理分类。每个像素3 x3的邻里中心价值和考虑结果转换成一个二进制数,对应的十进制数用于标签。派生的二进制数被称为局部二进制模式或枸杞多糖代码。 |
结果8位的十进制形式词(枸杞多糖代码)可以表示如下: |
|
其中n =数量的邻居对中心像素 |
在= n邻近的像素像素强度 |
ic =中心像素的强度。 |
r =最大数量的中心像素周围的邻居。 |
这里r = 8和函数s (x),表示二进制强度每个单元的定义是: |
|
通过上面的定义,LBP算子是不变的单调灰度转换保存像素强度的顺序在当地社区。枸杞多糖的直方图计算标签在一个地区可以利用纹理描述符。限制的基本LBP算子是小3 x3社区不能捕获大型结构的主导功能。结果,处理纹理在不同的尺度上,操作员需要扩展使用社区的大小不同。 |
b多尺度枸杞多糖 |
多尺度枸杞多糖[13]是一个扩展基本的枸杞多糖,对社区不同的大小。在多尺度-枸杞多糖,一圈是由半径R从中心像素。P采样点在这个圆的边缘被并与中心像素的值。图3显示了一些示例的多尺度LBP算子,在符号P (P, R)代表一个社区的采样点一圈半径R。 |
c .制服枸杞多糖 |
LBP算子的枸杞多糖(P, R)产生2 P不同的输出值,对应2 P P像素不同的二进制模式形成的社区。人们已经发现,某些模式包含了比其他人更多的信息[13]。可以使用只有一个子集的2 p二进制模式来描述图像的纹理。Ojala等人命名这些模式统一模式[13]。局部二进制模式叫做制服,如果它包含最多两位转换从0到1,反之亦然,当对应的位串被认为是圆形的。11111111,11111111或11111111例如统一模式。 |
d .扩展枸杞多糖 |
黄等。[14]报道,枸杞多糖只能反映图像的一阶导数信息,而不能代表当地的速度变化。所以他们提出了一个扩展的枸杞多糖通过应用这两个梯度的枸杞多糖运营商级图像和原始图像。为此,他们只是应用kernelsLBPu2 (S1), LBPu2 (S2)和原始图像和梯度图像。大约在同一时间,当最初的LBP算子引入Ojala [12], Zabih和伍德菲尔[26]提出了一种局部结构特征非常相似。这个特性称为普查变换,也将附近周围的像素映射到一个位串。关于枸杞多糖,人口普查变换只通过比特串的顺序不同。 |
特征提取使用修改后的枸杞多糖 |
特征提取算法,以减少输入数据和传输特征向量。如果特征提取是精心挑选的,预计的特性集将从输入数据中提取相关信息,以执行所需任务使用这种表示而不是全尺寸的减少输入面图像。脸图像可以看作是一个小格子组成所描述的枸杞多糖。LBP直方图的计算在整个脸部图像编码只有小的出现没有任何指示的位置。考虑脸的形状信息,Ahonen等。[15]提出把脸图像分成m当地区域提取枸杞多糖直方图和连接成一个单一的空间增强的特征直方图(图4)。8主要面部组件如眉毛,眼睛,瞳孔,鼻子和脸边界被选为空间模板图5所示保护面部组件的形状信息。 |
只有那些空间模板,所有面部组件可以描述;例如,鼻子可以被描述为一个联盟的模板0,5和6。然而,空间信息和局部纹理信息可以综合提高的能力描述的面孔。这里只考虑中心像素的PC和其每个邻域像素的原始LBP算子做了,我们使用每一对两个邻域像素(₁,皮)根据空间模板与中央像素比较电脑。八个空间模板形成8个二进制数字修改枸杞多糖(15、16)。所以新LBP算子的枸杞多糖的价值观产生256种不同的修改。功能(1)给出了计算修改后的枸杞多糖的数字。 |
|
上述修改的LBP直方图用于表示一个脸。但部分人脸可以阻挡太阳眼镜,人体器官或其他复杂的对象。如果我们只使用单一的LBP直方图整张脸候选人形象,阻塞将严重影响匹配算法。一般来说,人类面临两个最重要的部分:从鼻子到额头和上部下部从鼻子到脖子,包括鼻子,嘴巴,嘴唇、下巴和脖子。所以我们应该计算每个部分由个人直方图。这两个直方图连接顺序创建一个混合255 x 2直方图代表面对候选人形象。通过这种方式,我们可以减少有效遮挡的影响。图7显示了灰度图像样本,其修改后的枸杞多糖形象和直方图。 |
算法 |
该算法的主要目的是将统计和神经网络的优势特性,以建立一个混合系统根据两种方法的优点。本文改进算法使用枸杞多糖和直方图特性作为特征提取的统计方法和多层前馈网络的使用分类器作为分类的神经网络方法(8、17、18)。这种多层前馈网络反向传播学习规则的基础上工作。一旦使用枸杞多糖和直方图特征提取属性,一张脸图像转化成一个特征向量,应用多层前馈网络分类器分类。多层前馈神经网络的神经元由命令成层。第一层称为输入层,最后一层称为输出层和它们之间的层次是隐藏层。每个神经元的映射函数Γ分配我一个子集由给定的神经元的所有祖先。每个神经元在特定层与下一层的所有神经元。i和j神经元之间的连接的特点是重量系数维琪。输出神经元的价值被认为是一个模式类。 The Multilayer Feed Forward Neural network operates in two mode viz Training and Test mode [27]. Training mode begins with arbitrary values of the weights and process iteratively. In each iteration the network adjusts the weights in the direction that reduces error by applying Back Propagation learning rule [28]. In Testing mode information flows forward direction through the network from inputs to outputs. The network producing an estimate of the output value(s) based on the input values and then finds similarity between the test image and trained images stored in database.The present output value with all existing pattern classes which are formed during training period.The proposed Multilayer Feedforward Network is shown in Fig.8 |
该方法的算法如下 |
第一步:上传输入图像预处理 |
步骤2:提取人脸特征组件(如鼻子、眼睛等使用提出修改LBP算法及其直方图特性得到的特征向量 |
步骤3:使用修改后的枸杞多糖提取的特征向量比送入多层前馈网络分类器。 |
•设定目标值接受分类器的性能 |
≈+ 1承兑 |
步骤4:分类器的训练和测试阶段 |
•选择合适的输入层的神经元数的价值。 |
•选择隐层数和每个隐层的神经元数。 |
•选择合适的传输函数像“tansig”“traingdm”从一层到另一个。 |
•选择学习速率(lr)值设置可测试的条件下 |
•选择数量的时代。 |
•应用反向传播学习算法对每个时代 |
反向传播学习算法 |
•输入=一组训练对{(x (k), d (k) | k = 1, 2,…, p} |
x (k) =特征向量 |
p =总没有。的培训模式 |
•处理步骤: |
•步骤0:(初始化)选择η> 0,Emax设置E = 0 k = 1。 |
•步骤1:(培训循环)k输入模式应用到输入层。 |
•步骤2:(向前传播)传播的信号通过网络。 |
•步骤3:(O / p误差)计算错误 |
•值E = 1/2Σ(di (K) -易(K)) 2 + E |
•步骤4:(误差传播)误差向后传播更新权重。 |
•步骤5:(一个时代循环)如果K < P K = K + 1,转到步骤1。 |
•步骤6:(总错误检查)检查当前是否总误差是可以接受的。如果E < Emax然后终止训练过程和o / p最后的重量,否则E = 0 K = 1,转到步骤1。 |
实验结果和讨论 |
我们实现该方法,进行实验来评估其有效性。我们的结果我们选择面对太监和前处理的图像在应用该方法。该方法是使用MATLAB实现版本10.0在英特尔酷睿i3处理器电脑4 GB的RAM内存。多层前馈网络分类器参数的变化有一个高对分类结果的影响。在每层设置不同数量的神经元后我们发现,分类器效果最好的三个隐藏层,每一层的神经元数量100,50岁,分别为10。试验的数量由隐层的数量保持在三个实验已经发现的识别率是最佳当输入神经元的输入层的数量是10。隐层的数量一直保持在三的价值减少系统的硬件以及减少输入变量的传播时间降到最低。节省计算时间(包括训练和测试时间)会对节约成本。不同的学习速率参数如lr, mc,目标已经被使用为了得到最好的学习速率800时代。图9显示了与同一组识别率增加测试图像使用越来越多的输入图像为同一类培训期间的网络。我们发现最好的识别率为97.35%。识别率=((没有。of recognised face / No. of test face) *100). The results obtained by the proposed algorithm have been compared with those obtained by using orginal LBP operator alongwith feed forward neural network and the both were applied to the faces of eunuch faces obtained from the real life residence of India. It has been found out that the proposed algorithm outperforms the results obtained by applying the previous algorithm. |
结论 |
人脸识别提供了许多重要的应用程序和大量的方法提出了在过去的几年里。有几种技术已被提出了识别一般的人类,但到目前为止没有工作做太监脸上归类他们的性别。在本文中,我们提出了一个混合方法通过合并两种不同的方法用于特征提取和分类。这种混合方法产生一个好的结果太监识别和验证的高识别率。我们提出一个修改后的枸杞多糖提取技术的一些重要特性太监的脸,让他们为分类特征向量,降低计算成本。最后,我们使用了多层前馈网络的分类优化性能通过连续试验。 |
承认 |
作者要感谢教授P。科技研究所主任K .Bose阿加尔塔拉和r·p·夏尔马博士不断激励和支持。 |
数据乍一看 |
|
|
|
|
|
图1 |
图2 |
图3 |
图4 |
图5 |
|
|
|
|
图6 |
图7 |
图8 |
图9 |
|
引用 |
- w·赵r . Chellappa a·罗森菲尔德和p . j .菲利普斯“人脸识别:文献调查,”ACM计算调查,399 - 458年,2003页。
- Jyoti Rajharia P C古普塔博士,Arvind Sharma“基于指纹识别系统:——调查”ComputerTechnology国际期刊和电子工程(ISSN 2249 - 6343)卷1,问题3
- j . Daugman——“虹膜识别是如何工作的”,IEEE反式。电路与系统视频技术,14卷,没有。1,页21 - 30 1月。2004年。
- DibyenduGhoshal Parthasarathi De, BapiSaha“人口普查的方法识别老虎老虎虹膜模式匹配常胜”国际期刊《计算机应用(0975 - 8887),体积49 - 2号,2012年7月
- en.wikipedia.org/wiki/Eunuch
- A .哈迪德、m . Pietikainen和t . Ahonen”检测和识别人脸的歧视特征空间,“在Proc。Int. onf。ComputerVision和模式识别(CVPR), 2004年,页797 - 804。
- BorutBatagelj,法郎Solina”人脸识别在不同的子空间——一个比较研究”,第六届国际作品跳上PatternRecognition在信息系统中,取了2006年与ICEIS 2006年5月23 - 24日,2006年,帕福斯、塞浦路斯。
- m . Turk, a . Pentland“Eigenfaces识别,”j .认知神经科学13卷,没有。1,第86 - 71页,1991。
- Chelali FatmaZohra“线性判别分析人脸识别”IEEE会议多媒体计算和系统2009 icm„09年
- m . s . Bartlett、j . r . Movellan和t . j . Sejnowski”由独立分量分析人脸识别,IEEE反式。神经网络,vol.13,没有。6,1450 - 1464年,2002页。
- s . Marcel y罗德里格斯,g . Heusch“最近使用的局部二进制模式脸上认证,“Int。j .形象和面部图像处理性能特殊的问题,2007年
- t . Ojala和m . Pietik¨ainen和d·哈伍德”比较研究纹理措施分类基于分布”,模式识别、卷29日51-59,1996年。
- t . Ojala m . Pietikainen, t . Maenpaa”Multiresolutiongray-scale和旋转不变的纹理分类与局部二进制模式、“IEEE反式。模式分析与机器智能,24卷,没有。7,971 - 987年,2002页
- 黄x、z s李和y . Wang”形状定位基于统计方法使用扩展局部二进制模式,“在Proc, Int。Conf.Image和图形(ICIG), 2004年,页184 - 187。
- t . Ahonen哈迪德和m . Pietik¨ainen,“人脸识别与局部二进制模式”,欧洲计算机视觉,布拉格,469 - 481年,2004年。
- Phuong-Trinh Pham-Ngoc Kang-Hyun乔”的基于人脸检测使用修改后的结合局部二进制模式和嵌入式隐马尔可夫模型”SICE-ICASE国际联合会议2006。
- T。Yahagi H.Takano,(1994)“人脸识别使用神经网络和多个类别的组合,”国际期刊ofElectronics信息和通信工程。,vol.J77-D-II,不。11日,.2151 - 2159页。
- 丹尼尔Svozil弗拉基米尔•KvasniEk JiEPospichal爱思唯尔介绍多层前馈神经网络,化学计量学和智能实验室系统39 43 - 62 (1997)
- C.M.Bishop,(1995)“神经网络模式识别”伦敦,英国:牛津大学出版社。
- j . Budynek M.J.里昂说:美国赤松、自动分类的单身面部图像,IEEE模式分析和MachineIntelligence 21 (12) (1999) 1357 - 1362。
- 伟峰,沿江Wang以北Shujuan李“LBP特征提取面部表情识别信息计算科学杂志》8:3 (2011)412 - 421
- 霍华德•德穆斯,马克比尔,”神经网络工具箱用户“年代指南使用MATLAB”由MathWorks公司。
- Caifeng山、Shaogang锣,彼得·w·McOwan“面部表情识别基于局部二进制模式:一个全面的研究“爱思唯尔杂志形象和视觉上计算27 (2009)803 - 816
- Prof.K。教授RamaLinga Reddy, G。R先生Prof.Lal基肖尔,M。Maanasa“基于多尺度特性和单个神经网络的认脸”理论和应用信息技术杂志》2008年
- http://www.face-rec.org
- r . Zabih和J。伍德菲尔”的非参数方法视觉通信”IEEE ransactions模式分析和machineintelligence 1996
- RoyaAsadi, Norwati穆斯塔法,NasirSulaiman NematollaahShiri“新监管多层前馈神经网络模型toAccelerate分类精度高”欧洲科研杂志Vol.33第一(2009),pp.163 - 178
- 罗摩博士基肖尔,TaranjitKaur“反向传播算法:一个人工神经网络模式识别方法的国际科学和工程研究杂志》上,卷3,问题6,2012年6月。
|