所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

不同光照下人脸识别与本地二进制模式

Ms.S.S。Ghatge, V.V.Dixit教授
E&TC学系Sinhgad工程学院,印度浦那大学
相关文章Pubmed,谷歌学者

访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程

文摘

的人脸识别系统在不受控制的环境中仍然是一个重大的挑战。找到有效的面部特征来表示的脸出现在人脸识别是最关键的方面。在这项工作中,我们提取局部特征是使用枸杞多糖对光照变化不敏感,枸杞多糖的性能又与当地的三元模式。我们使用度量距离变换和k-mean作为分类器。

关键字

人脸识别、正常化、狗、枸杞多糖LTP, k - means

介绍

本文主要关注照明变化鲁棒性的问题。例如,一张脸验证系统的便携设备应该能够验证一个客户在任何时间在任何地方(白天还是晚上)和(室内或室外)。不幸的是,面部出现强烈依赖于环境照明传统方法来处理这个问题大致可分为三类:外貌,normalization-based和基于功能的方法[1][2]。在本文中,我们提出一个综合框架,结合以上三个方法的优势。整个过程可以被视为一种管道组成的图像归一化、特征提取、分类器,如图1所示。每个阶段增加耐光照变化和识别所需的信息更明显。该方法集中在一组丰富的强劲的视觉特性,选择捕捉尽可能多的可用的信息。一个设计良好的图像预处理管道将进一步提高鲁棒性。在本文中,使用上述方法的组合。整个框架的示意图表示如下,其中包含预处理阶段,特征提取阶段,分类器识别阶段。
图像
图像
伽马校正——修正的初始水平照明不足。然而这并不删除整体强度梯度的影响,如阴影效果差高斯函数(狗)过滤-这包括一个模糊的减法版本的原始灰度图像从另一个更模糊的原始版本。
这极大地增强了图像的细节。
屏蔽——在这个阶段,像图片的蒙面无关的区域。
对比均衡——在这个阶段,新图像的强度。这一步是需要规范的强度值进一步处理。

当地纹理提取

答:局部二值模式(LBP)

枸杞多糖操作符[3]是表现最好的纹理描述符之一,它已广泛应用于各种应用程序。它已经被证明是非常歧视及其关键优势,即其不变性单调灰度变化和计算效率,使它适合要求图像分析任务,使用枸杞多糖面描述的想法是出于脸可以被视为组成的小格子都被这样的运营商,LBP算子的最初设计用于纹理描述。操作员分配一个标签图像的每个像素的阈值3 x3-neighborhood每个像素与中心像素值和考虑结果转换成一个二进制数。的柱状图标签可以用作纹理描述符。图3给出了一个说明的基本LBP算子。枸杞多糖运营商正式形成
图像
在这种情况下n运行/ 8邻居中央像素c, ic和灰度值c和n s (u) = 1如果u≥0 0吗
图像
两个扩展原始的运营商在[3]。第一个定义枸杞多糖对社区不同的大小,从而使它可行的处理纹理在不同的尺度上。第二个定义所谓的统一模式:局部二进制模式叫做制服如果二进制模式包含最多两位转换从0到1,反之亦然当位模式被认为是圆形的。例如,模式00000000(0转换),01110000(2转换)和01110000(2)的转换是统一而模式11001001(4转换),11001001(6)的转换。计算的LBP直方图,使用统一的模式使得直方图有一个单独的本为每一个统一的模式和所有非均匀模式被分配到一个垃圾箱。一致性是很重要的,因为它描述了补丁包含原始结构信息,如边缘和角落。Ojala等人观察到,尽管只有58 256 8位模式是统一的,近90%的所有观察到的图像社区统一和许多剩余的含有噪声。因此,当直方图枸杞多糖可以显著减少箱子的数量将所有非均匀模式分配给一个垃圾桶,通常没有失去太多的信息。
面部图像分为本地区域和纹理描述符提取每个区域独立。描述符然后连接形成一个全球的描述的脸。见图4为例的面部图像分为矩形区域。
图像
基本的直方图可以扩展成一个编码空间增强的直方图外观和面部区域的空间关系。m面部区域R0, R1…。Rm-1已经确定,一个直方图计算在每个独立的地区。结果m直方图结合产生空间增强的直方图。空间增强的直方图有大小(mxn其中n是一个单一的LBP直方图的长度。空间增强的直方图,我们有效的描述在三个不同的地方:直方图的枸杞多糖标签包含的信息模式进行像素级,标签是求和生产信息在区域层面上的小区域和区域直方图连接建立一个全球面临的描述。应该注意的是,当使用基于直方图的方法,尽管图4中的示例,该地区R0, R1……Rm-1,不需要矩形。也不需要相同的大小或形状,他们不一定要覆盖整个图像。例如,他们可能是圆形区域位于基准分像EBGM方法。也有可能有部分重叠的区域。
图像

b .当地三元模式(LTP)

枸杞多糖已被证明是高度区别的特征纹理分类[3]他们对灯光效果在某种意义上,他们不变的单调灰度转换。然而因为他们阈值在中央像素的价值他们往往是对噪声敏感,尤其是在近似统一形象的地区,光滑的弱光照梯度。许多面部区域相对统一和合法调查是否可以提高鲁棒性的特性在这些地区。本节延伸LBP 3-valued代码,LTP,灰度的区域的宽度大约ic量化为零,上面的这是量子化的+ 1和它下面的1,即。年代,指标(u)被替换为一个3-valued函数
图像
代码和二进制枸杞多糖取代三元LTP的代码。这里t是一个指定的阙值LTP编码对噪音抗性更强,但不再严格不变的灰度转换。LTP编码过程见图6。这里的阈值设置为5,所以容许区间[49,59]。
图像
当使用LTP视觉匹配时,我们可以使用价值规范,但统一的模式参数也适用于三元的情况。为简单起见,下面的实验用一个编码方案,将每个三元模式分为积极的和消极的部分如图7中所示,随后把这些当作两个独立通道的LBP描述符的单独的直方图和相似性度量计算,结合只有最后的计算结果。
图像

基于距离变换的相似性度量

的相似性度量是基于LBP的方法用于人脸识别[2],面对分为普通网格细胞和直方图均匀LBP在每个细胞,最后使用最近邻分类χ2直方图距离的识别:
图像
这里p, q是图像区域描述符(直方图向量),分别
然而,细分成常规电网似乎有些武断:细胞与面部特征并不一定好,和分区可能导致混叠(由于突然空间量子化描述符贡献)和空间分辨率损失(如位置在每个网格单元不是编码)。考虑到编码的总体目标是提供照明,outlier-robust视觉与一些回旋余地小的通信空间偏差由于错位,似乎更适合使用分离,远远看去就像相似性度量,每个枸杞多糖或LTP像素在图像和测试代码是否相似的代码出现在附近的位置在图像的权重降低顺利,图像的距离。这种方案应该能够实现判别外貌的图像匹配与well-controllable程度的空间松动。我们可以使用距离变换来实现这一点。给定一个二维参考图像,我们发现其形象的枸杞多糖或LTP的代码,转换成一组稀疏二进制图像,每个可能的枸杞多糖或一个(即LTP代码值。为统一规范),59岁的图片。每个指定的像素位置其特定的枸杞多糖或LTP代码值出现。然后我们计算的距离变换的形象。给出了距离最近的图像的每个像素像素与代码(二维欧氏距离是在下面的实验中使用)。距离或从图像到图像的相似性度量
图像
这里的代码值像素的图像,一个用户定义的function4给予的处罚包括像素在给定的空间距离最近的匹配的代码。在我们的实验中我们测试了高斯相似性度量和截断直线距离。他们的表现是相似的,与截断距离给稍微更好的结果。120年x120面临的虹膜图像或鼻孔有大约6像素半径和全球面临对齐是几个像素,我们默认的参数值是像素和像素。

d . K-MEAN算法

k - means是一种最简单的无监督学习算法,解决聚类问题。过程遵循一个简单而简单的方法对给定的数据集进行分类通过一定数量的集群(假设k集群)固定的先验。主要的思想是定义k形心,每个集群。这些重心应该放在一个狡猾的方式,因为不同的位置导致不同的结果。所以,更好的选择是把它们尽可能远离对方。下一步是把每一个点属于一个给定的数据集,并将最近的重心。等待毫无意义时,第一步是完成和早期组年龄就完成了。在这一点上我们需要计算k新的重心,对于上一步产生的集群中心。我们有这些k新的重心之后,一个新的绑定相同的数据集之间要做点和最近的新的重心。生成一个循环。 As a result of this loop we may notice that the k centroids change their location step by step until no more changes are done. In other words centroids do not move any more Finally, this algorithm aims at minimizing an objective function, in this case a squared error function. The objective function,Where is a chosen distance measure between a data point and the cluster centre , is an indicator of the distance of the n data points from their respective cluster centers.
我们的实现步骤:
1。测试与数据库模板之间的距离计算。
2。所有的距离都按升序排序
3所示。前5的值被用来作为K-Mean重心
4所示。发现重复的值使用模式校正

实验结果

以下是预处理阶段后的结果:
图像
图像
最终结果后距离变换匹配算法和k - means算法
图像
我们使用裁剪耶鲁数据库通过使用它以后,就得到了识别率
图像

结论

我们提出了人脸识别新方法在不受控制的照明基于健壮预处理和枸杞多糖局部纹理描述符的延伸。主要贡献如下:一个简单的、有效的图像预处理链的实际识别性能相当或比当前的(通常是复杂得多)照明标准化方法,为当地纹理丰富的描述符叫做LTP,概括了枸杞多糖在破碎少噪音均匀区域:一个基于距离变换的相似性度量,捕捉当地的枸杞多糖的结构和几何变化/ LTP的脸图片比目前使用的简单网格的直方图,利用kmean分类器识别率进一步改善

引用





全球技术峰会