关键字 |
人识别、局部二进制模式直方图,中性,微笑的表情,视觉语言,准确性,F1的分数。 |
介绍 |
图像处理在使用算法和计算机数字图像被称为数字图像处理。主题密切相关的数字图像处理是计算机视觉,包括捕获和处理图像,主要来自视频和决定根据处理结果。目标识别是计算机视觉的一个重要组成部分。对象识别的一个重要应用是人身份验证。身份验证可以两种类型的人。它可以是人或个人身份验证。人验证是一个一对一的比较,而人的识别是一个一对多的比较。随着精度和召回,许多的人识别系统是测量质量使用准确性和F1分数[1]。人验证的性能通常是用平等的错误率[2]。七个基本面部表情愤怒、厌恶、恐惧、幸福、中性、悲伤和惊讶[3]。 Among these we use only the neutral and smile expressions for our research comparison in addition to visual speech. Visual speech is detecting visually the mouth region speech activity [4]. Yaw, roll and tilt are poses of faces which degrade the performance of person authentication system. In our research an extension of the automatic pose free face detector used in [5], hereafter called as extended pose free face detector is used. Using local binary pattern histogram, person identification performances while using neutral, smile facial expression and visual speech are compared with our custom dataset. Using methodology used in [5], person verification performance comparison while using neutral, smile facial expression and visual speech using auto associative neural network is checked with our above dataset. Auto associative neural network when trained with features of facial and visual speech has the potentiality to learn the features to be compared later while testing [6]. The comparative performances of above both person authentication while using neutral, smile facial expression and visual speech are compared while using auto associative neural network and local binary pattern histogram. The objective of the work is to find out the best among neutral face, smile facial expression and visual speech on which better automatic person authentication systems can be built upon. |
第二部分解释了相关的工作。第三部分解释了对提出的工作。第三部分解释了扩展构成自由口地区的人脸检测器和本地化。第三部分B为扩展造成的伪代码免费口地区的人脸检测器和本地化。第三部分C解释关于自定义数据集。部分三维解释的人识别系统。第三部分E解释循环局部二进制模式直方图。第三部分F解释精度,精度、回忆和F1的分数。第四部分是分析的结果。第五部分是结论和未来的工作。 |
相关工作 |
为了避免由于扩展的问题,鼻子可以作为阈值的相对大小。错误的拒绝在选择合适的图像视频可能会减少验证系统的时间效率,但不是完美[5]。人脸识别的研究基于一个脸是非常少的一部分。阻塞和姿势变化、光照变化也扰乱了人脸识别系统的准确性。脸对齐是一个重要的步骤在人脸识别系统,主要是他们用眼睛或一些特定地标在面对像主动形状模型和主动外观模型。除了正面视图在人脸识别需要一般使用具有里程碑意义的生成正面视图本地化,将高度被阻塞。近红外图像还可用于识别,但所需的图像质量非常高的和不宽容。一半的脸或组件的脸像耳朵,鼻子,嘴和眼睛可以用于识别。类似,面对区域可分为手动分成许多小区域,可以用于识别结合管理阻塞[7]的结果。 |
普罗克汝斯忒斯的分析可以用来管理构成变化而确定里程碑脸图像。完美脸图像主要是被收购里程碑姿势变化除了照明。许多对齐算法无法管理构成差异,即使在它的起始阶段。整体人脸检测算法并不完美的管理难以捉摸的形状变化。在这种情况下基于地区面临的系统可以表现的更好。里程碑式的发现基于可变形模型和部分结构输出支持向量机工作更快,更完美。之间的一致性并不遵循手册土地[8]。 |
成功率的人脸识别方法,使用表象脸的姿势时,会减少很多的变化。培训视频提供更多的图片可以帮助提高人脸识别的准确性,即使有差异造成的图像探测的训练。更多的顶点模型拟合可以给更多的人脸识别的准确性,但是需要更多的计算资源,因此不能用于实时系统。眼睛是用来识别时,应该非常和鼻子附近表现出相似性,但是说话嘴巴显示良好的人之间的差异。面对正常化,下巴区域可以被排除在外的特征点下巴不对齐。此外下巴区域无法显示出足够的差异来提高识别。图像的数量增加的培训提高了识别结果的准确性,即使有姿态的变化。如果手动贴上地标,错误可能高,它也不能在规定的时间完成。在某些情况下,相同的具有里程碑意义的可能指出的不同研究,这进一步增加了复杂性。自动检测口并不是成功的[9]。 |
面临的阻碍区域识别和图像没有障碍物,然后创建用于识别。开始对齐尽管姿势的变化主要决定的质量导致这样的识别系统。许多研究人员在人脸识别中使用预先确定的阈值去除障碍,但它不会给好的结果都面临数据库。识别和删除对象妨碍脸,主成分分析方法通过使用脸比较平均。在这个研究中,200000年时代需要的神经网络训练得到期望的结果[10]。 |
无数的人脸识别系统表现良好在标准数据库,在现实生活中表现得非常失败的情况下,他们不能够处理变化的照明和随着障碍物同时对齐。整体分析的人脸识别方法可以快速、也不是很复杂,但是它的质量迅速下降,当遇到遮挡脸图像。2 d技术构成变化存在时给出更好的结果。基于模型的技术增加了系统的复杂性。增加图像的数量有助于克服困难,由于灯光的变化。稀疏表示和分类算法提供良好的结果限制环境图像和失败在现实生活的情况下,因为它总是假设完美的配件的图片。没有公开的脸图像构成与高浓度取样。现实世界照明条件不在多派面临数据集。包含前额通常降低准确性可能阻塞频繁的头发。两个底部角落的脸图像可以排除很多次它包含内容背后的脸。 Many algorithms fail to provide good results, when alignment fails. Local Binary Patterns can perform well even when lighting varies. Outer edges of the eyes are usually used for alignment [11]. |
没有现有的方法是能够管理的姿势变化完美人脸识别任务。几乎所有的人脸识别系统并不是在现实世界的情况下进行测试。通常三维图像生成方法非常耗时和不完美在真实世界的情况下采用[12]。 |
在面孔识别,基于部分的方法执行比整体分析方法[13]。识别基于局部二进制模式直方图不是困扰,这有助于系统工作迅速[14]。与方法处理面临着作为一个整体,局部二进制模式方法,处理面临作为组件的组合,可以执行当姿势和光线的变化存在[15]。 |
提出工作 |
a .扩展构成自由面探测器和本地化的地区: |
在这方面,视频源的视频帧构成自由面临着被检测到。除了嘴地区也发现使用我们提出的工作仍在继续。从视频源,人脸检测是用延长组哈雾像特性[16],[17]的一种改进形式。鼻子是发现使用在[18]使用模式,知识和时间相干性。与多个脸或多个视频帧检测到鼻子前两个步骤过滤[5]。探测器利用可变形模型的一部分使用结构化输出支持向量机[19]是用来识别地标的脸。从检测到的地标,鼻子尖,唇角是用来定位口地区。口鼻宽度指定的宽度。嘴部区域的宽度的一半是指定为口地区的高度。使用的相对量,即使在扩展,同一地区的脸将标记为口地区为一个特定的人。 Nose tip is used to calculate the mouth region horizontal centre. The centre of the vertical line between a lip corner and the nose tip is assigned as the mouth region top. From the mouth region top and mouth height, mouth region bottom is identified. From the mouth region horizontal centre and mouth region width, mouth region both sides are identified. Thus the mouth region is completely localized. Video frames are rejected if any one lip corner is above or below the mouth region, if one lip corner is inside and the other outside the mouth region horizontally, if the absolute difference of right and left side horizontal distance of the lip corner from the mouth region is greater than 5% of nose width, if the absolute difference of right and left side vertical distance of the lip corner from the nose tip is greater than 10% of nose width as like in [5]. Above pose free face detector gives perfect pose free faces, but it has some rare images when the face is in a little far off distance from the camera, where face is detected correctly, but nose is detected wrongly by detecting the entire face, which leads to wrong mouth region detection. To eliminate this, the pose free face detector is extended as extended pose free face detector. In extended pose free face detector, video frame is initially accepted only if the face width is greater than double the width of nose, which increases its performance accuracy further. Sample automatically localized extracted mouth regions of thirty persons during neutral face are shown in Fig. 1 |
b .伪代码扩展构成自由面探测器和本地化的地区: |
步骤1:检测的脸和鼻子独立于视频源。 |
步骤2:如果(发现鼻子数量> 1或数检测的脸> 1)视频帧将被拒绝 |
步骤3:如果(2 x的鼻子宽>表面宽度) |
视频帧将被拒绝。 |
步骤4:鼻子尖,两唇角自动识别。 |
第五步:鼻子尖,唇角是用来定位口地区详细的上面。 |
第六步:如果(高于或低于任何一个唇角口地区)的视频帧被拒绝 |
第七步:如果(一个唇角落里面,嘴外的其他区域水平)的视频帧将被拒绝 |
第八步:如果((绝对差(左、右唇角之间的距离对嘴地区))> 5%的鼻子宽)的视频帧将被拒绝 |
步骤9:如果(绝对差(左、右唇角之间的垂直距离鼻子尖)> 10%的鼻子宽)的视频帧将被拒绝 |
第十步:剩下的视频帧与构成自由面临着接受视频帧 |
c .自定义数据集: |
对于我们的数据集,包括视频记录不同姿势的脸。人要求展览姿势,辊倾斜和偏航。视频记录在正常照明条件和中性的,微笑的表情和视觉语言。两个交易日的录像已经完成的差距大约20天。三十人记录了其中四个是女性。因此数据库变得非常大的包含180个视频,因为它包含了两个交易日与中性30人,微笑的表情和视觉语言。每个视频的长度大约是两分钟。视频的分辨率是640 x480 15帧每秒。 |
d .人识别系统: |
对于这个提议人识别系统使用局部二进制模式直方图,嘴部区域的图像从扩展得到了作为输出给人带来自由面探测器是用来输入训练和测试。图2显示了系统的用户界面。十口区域图像从第一个记录会话被每个人培训培训在局部二进制模式直方图模型和标签为每个人。模型训练后,十口区域图像从第二个会话记录了每个人进行测试。最初50用于模型的阈值和所有十图像进行识别。如果任何图像失败从数据库中识别,识别过程是重复与阈值60。阈值增加每次在十个步骤,直到达到一个阈值,从数据库中所有十图像识别。重复该过程对于所有30人中立,微笑的表情和视觉语言独立和混淆矩阵是由输出。使用混淆矩阵数据和eq。(1), eq。(2), eq。(3)和eq。(4)的准确性,计算精度、回忆和F1的分数。结果值如表1所示。 |
e .圆形局部二进制模式直方图: |
输入灰度图像分成较小的部门生成的直方图特征和组合,形成一个称为局部二进制模式直方图特征向量。在局部二进制模式中,对于每一个像素,其邻近的像素的强度。如果像素强度大于其附近的像素,然后如果小1被认为是0。这样附近为每个像素生成一个1或0组成一个8位二进制数,如果附近8像素被认为是。图3显示了一个示例生成局部二进制模式。所以对于一个像素有256的可能性局部二进制模式从00000000到11111111。管理不同比例下,选择附近的像素像素在考虑与从一个圆的半径的变化。如果两个像素得到由一个点,然后采用双线性插值得到的价值。局部二进制模式被认为是统一和圆形如果它没有改变从0到1,00000000或00000000或两种转换从0到1,然后从1到0或1到0,0到1,第一个和最后一个点是一样的。不均匀的模式构成大约10%的当地所有的二进制模式纹理。 Hence while generating local binary pattern histogram, one independent bin is used for all non uniform patterns. All remaining uniform patterns use each one a bin. Circular local binary pattern is also called as extended local binary pattern. If the number of nearby points from the circle is 8 and radius is 2 pixels, then it is denoted as (8,2). Chi square minimum distance estimation is applied to compare histogram. This performs well even when poses and gray level varies. Prior to using local binary pattern on the image there is no need to normalize the intensity values which increases the efficiency [15]. If the size of each division is large, the length of the feature will be short. This short feature helps for faster performance. As the variation of size and other parameters does not vary the result much, time need not be wasted for finding the best parameters [14]. |
f .准确性、精密、召回和F1分数: |
准确度,精密度,回忆和F1分数通常用于比较分类器的质量。混淆矩阵,真正积极的正确的人的关注。假阳性的人虚假的关心人。真正的底片是正确数量的人确认为不正确的人。假阴性的人错误地认定为不正确的人。 |
精度的比例之和真阳性和真正的阴性的总和之间的真阳性,真正的底片,假阳性和假阴性。它是计算使用eq。(1)。 |
|
精度是真阳性的比例真阳性和假阳性的总和。它是计算使用eq。(2)。 |
|
回忆真阳性的比例在真阳性和假阴性的总和。它是计算使用eq。(3)。 |
|
通常,精度和召回得分结合成一个单一的测量,称为F-measure [1], [20], [21]。传统F-measure平衡的f值或F1分数是调和平均数的精度和召回。另外两个常用F措施F2措施,其权重召回高于精度,和F0.5测量则重量精度高于回忆。使用eq F1分数计算。(4)。 |
|
分析的结果 |
在这个工作,在使用中性,微笑表达和视觉说话人识别、视觉语言显示相对更高的精度,精度、回忆和F1得分,其次是在使用中性的脸和性能是至少在使用微笑的表情。相似的结果记录下来,人验证使用汽车联想神经网络在[5],规模较小的数据集使用比用于这项工作。上面相同的方法操作在180年的这个数据集视频也给出了类似的结果。图4显示了平等的错误率汽车关联验证基于神经网络的人,在使用中性面为0.37。图5显示了平等的错误率汽车关联验证基于神经网络的人,而用微笑表达为0.41。图6显示了平等的错误率汽车关联验证基于神经网络的人,在使用视觉语言为0.36。图7显示了准确性、精密、召回和F1得分基于局部二进制模式直方图人识别,在使用中性的脸,微笑的表情和视觉语言。在所有的性能措施的人在使用视觉识别表现良好演讲其次是中性的脸。 |
结论和未来的工作 |
在这个工作对人的身份验证,得出是否可以验证或人识别、视觉的演讲给了很好的性能比中性的脸和中性的脸执行比微笑的表情。也得出结论,嘴部区域的组成部分,面对人本身是有效的身份验证。未来的工作在这可能是使用其他组件的独立面对人的身份验证。验证结果独立面对组件可以组合的基础上没有遮挡脸组件。 |
表乍一看 |
|
表1 |
|
数据乍一看 |
|
|
引用 |
- 玛丽娜Sokolova,娜塔莉Japkowicz斯坦Szpakowicz,“除了准确性,f值和中华民国:一个家庭判别措施forPerformance评价,“在诉讼19澳大利亚联合会议上人工智能,4304卷,第1021 - 1015页,霍巴特,澳大利亚,2006年12月4 - 8。
- Balasubramanian m、s Palanivel和诉Ramalingam,“窝强度比较人识别和验证,代码”工程的应用人工智能,23卷,没有。8日,第1290 - 1277页,2010年12月。
- Phung Peiyao李的儿子林、AbdesselamBouzerdoum FokHing Tivive,“自动识别和中性FacialExpressions微笑,”国际研讨会论文集在数字图像计算:技术和应用,页。581 - 586年IEEE,悉尼,澳大利亚,2010年12月1 - 3。
- 凯特Saenko凯伦Livescu迈克尔·锡拉库萨詹姆斯玻璃,凯文•威尔逊和特雷弗·达雷尔视觉语音识别与LooselySynchronized功能流,“第十届国际研讨会论文集在计算机视觉,页。1424 - 1431年IEEE,北京,中国,2005年10月17日。
- Balasubramanian美国萨拉瓦南、美国Palanivel和m .,“面部表情和视觉语言基础的人认证,“InternationalJournal计算机应用,100卷,没有。2014年8月6页地位。
- 美国Palanivel, b . Yegnanarayana“多峰人身份验证使用语音,脸和视觉的演讲,“计算机视觉和ImageUnderstanding, 109卷,没有。但不心浮气躁;年龄1,页。2008年1月。
- Shengcai廖,Anil k . Jain”部分人脸识别:对齐方式,自由”国际生物识别技术JointConference论文集,页1 - 8,IEEE,华盛顿特区2011年10月,美国,11 - 13。
- 项羽,黄Junzhou Shaoting张(音译,Wang和迪米特里n .迈塔克瑟白兰地”Pose-free面部通过优化PartMixtures里程碑式的拟合和级联可变形形状模型,“计算机视觉国际研讨会论文集,页。1944 - 1951年IEEE,悉尼,澳大利亚,2013年12月3 - 6。
- HuaGao, HazA±m凯末尔Ekenel, Rainer Stiefelhagen”给当地带来正常化外貌的人脸识别,“第三国际会议将生物识别技术的进步,卷5558页。32-41,阿尔盖罗,意大利,2009年6月2 - 5。
- ParamaBagchi、DebotoshBhattacharjee MitaNasipuri”,强大的3 d人脸识别的姿势和部分遮挡或失踪的部分,”在计算机科学和技术的基础,国际期刊4卷,没有。2014年7月4 21-35页。。
- 安德鲁•瓦格纳约翰•赖特Arvind Ganesh,周子寒,HosseinMobahi,马和彝语,“对一个实际的人脸识别系统:强大的校准和照明通过稀疏表示,“IEEE模式分析与机器智能,34卷,没有。2,第386 - 372页,2012年2月。
- 盾,甄Lei,斯坦·李z”姿势的人脸识别,“第26届IEEE研讨会论文集ComputerVision和模式识别,页。3539 - 3545年IEEE,波特兰,俄勒冈州,2013年6月美国、23-28。
- 吴Bernd Heisele, Purdy Ho,简,TomasoPoggio,“人脸识别:基于组件的和全球的方法,”计算机视觉andImage理解,91卷,没有。2003年7月1 - 2日,页。6-21,。
- TimoAhonen、AbdenourHadid MattiPietikainen”人脸识别与局部二进制模式”,在计算机视觉第八EuropeanConference学报》,3021卷,第481 - 469页,布拉格,捷克共和国,2004年5月11 - 14号。
- TimoAhonen、AbdenourHadid MattiPietikainen”,面对与局部二进制模式描述:人脸识别应用,“IEEETransactions模式分析与机器智能28卷,没有。12日,第2041 - 2037页,2006年12月。
- Rainer Lienhart JochenMaydt,“一组扩展的Haar-like特性快速目标检测,”在美国InternationalConference图像处理,1卷,第903 - 900页,IEEE,罗切斯特,纽约,美国,2002年9月22日至25日。
- 保罗中提琴,迈克尔·琼斯,“快速目标检测使用一个简单的特性,提高了级联”在《IEEE ComputerSociety计算机视觉与模式识别、会议期,页我- 511 - 518,IEEE,考艾岛,夏威夷,2001年12月美国、08-14。
- m . Castrillon o . Deniz c . Guerra m·埃尔南德斯“ENCARA2:实时检测多个面孔在视频流在不同的决议,”杂志的视觉传达和图像表示,18卷,没有。2,页130 - 140,2007年4月。
- 米甲Uricar Vojtech法郎和VA¡clavHlavA¡c”探测器的面部地标结构化输出支持向量机学习,“第七届国际联合会议将计算机视觉、成像和计算机图形学理论和应用,卷,1页。547 - 556年,罗马,意大利,2012年2月24 - 26日。
- 闽胡锦涛和Bing刘”,挖掘和总结顾客评论,“在第十届ACM SIGKDD国际诉讼Conferenceon知识发现和雷竞技苹果下载数据挖掘,页。168 - 177年,西雅图,华盛顿,美国,2004年8月22日至25日。
- 玛丽娜Sokolova、ViviNastase Mohak沙斯坦Szpakowicz,“电子谈判文本特征选择,”国际研讨会论文集在自然语言处理的最新进展,页518 - 524,Borovets保加利亚、研讨会,2005年9月。
|