ISSN在线(2319 - 8753)打印(2347 - 6710)
Mitul莫迪1,Fedrik Macwan2 PG学者,电子称,M S大学,巴罗达,印度古吉拉特邦 |
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际创新研究期刊》的研究在科学、工程和技术
现在一天的脸在社会交往中扮演主要的角色传达身份和感情的人。人比机器有不可思议的能力来识别不同的面孔。人脸检测在人脸识别中扮演着主要的角色,面部表情识别,head-pose估计,人机交互等人脸检测是一个计算机技术,确定人脸的位置和尺寸任意(数字)的形象。本文所有理解和关键算法通过人脸检测的调查是可能的。本文为作者提供了格式化指令准备论文发表在《国际日报》。作者必须遵循文档中给出的说明论文的发表。您可以使用此文档作为一个指令集和一个模板,你可以输入你自己的文本。
关键字 |
数字图像处理,人脸检测,本地化的面孔。 |
介绍 |
早期的努力在人脸检测追溯到早在1970年代初,在简单的启发式和人体测量技术[1]。这种方法基本上是可靠等不同的假设额的脸,固定或简单的背景、护照大小的照片场景。如果任何改变发生在条件,在图像没有检测到。在1990年初的[2]技术提出了集中在人脸识别和视频编码系统,提高人脸检测的需要。更健壮的分割方案已经提出,特别是那些使用运动,颜色和广义信息。统计和神经网络的使用也使得人脸检测到从凌乱的场景在不同距离的相机。 |
人脸检测的概念可以以不同的方式实现但是我们主要使用两个步骤来实现的。第一步是本地化面对这意味着我们启发的那部分图像,一张脸。最后一步是验证的部分是否执行一脸[3]。上面的概念说明可能看起来很简单,但当我们实现它,我们可能会经历一些困难(4、5)规模、旋转,姿势,表情,是否存在一些结构组件、遮挡、光照变化和图像的条件。本文档是一个模板。可以从会议网站bedownloaded电子副本。问题onpaper指南,请联系会议publicationscommittee会议网雷竞技网页版站上显示。关于期末论文提交的信息可以从会议网站。 |
现代的人脸检测技术 |
人脸检测是计算机技术,确定人脸的位置和尺寸任意(数字)的形象。检测到的面部特征和任何其他物体像树木,建筑物和身体等从数字图像将被忽略。它可以被视为一个¢特定的对象类检测的情况下,任务是找到所有对象在一个图像的位置和大小,属于一个给定的类。人脸检测,可以被视为一个更¢将军的脸本地化。面对本地化,任务是找到的位置和大小的一个已知数量的脸(通常一个)。基本上有两种类型的方法来检测面部在给定的图像即功能基础和图像基础方法。功能基的方法试图提取图像的特征和它对脸的知识特性相匹配。虽然图像基础方法试图得到训练和测试图像之间的最佳匹配。 |
答:功能基本方法 |
1)主动形状模型 |
主动形状模型专注于复杂的非刚性的特点,如实际物理和更高层次的功能[6]。意味着主动形状模型(asm)旨在自动定位具有里程碑意义的点定义的形状统计建模对象在一个图像。当等面部特征的眼睛,嘴唇,鼻子,嘴巴和眉毛。ASM的训练阶段涉及的统计面部模型从一个包含图像训练集手动带注释的地标。asm是分为三组即蛇、PDM、可变形模板。 |
1.1)蛇: |
第一个类型使用一个通用的活动轮廓称为蛇,卡斯等人于1987年首次引入[7]。蛇是用来识别头边界(8、9、10、11、12)。为了实现这个任务,一条蛇是第一次初始化头边界周围的邻近。然后锁到附近的边缘,随后头的形状。一条蛇的进化是通过最小化能量函数,Esnake与物理系统(类比),表示 |
Esnake = Einternal + EExternal WhereEinternal和EExternal内部和外部能量函数。 |
内部能量的一部分取决于蛇的内在属性和定义它的自然进化。典型的自然进化在蛇正在缩小或扩大。外部能量抵消内部能量,使轮廓偏离自然进化并最终承担边界主管附近的形状特征—一种平衡的状态。 |
两个主要考虑形成蛇即选择的能源条件和能量最小化。弹性能量(8、9、11、12)通常用作内部能量。内部能量随蛇控制点之间的距离,通过它我们得到轮廓一个橡皮筋特点导致它缩小或扩大。另一边外部能量传递图像的特性。能量最小化过程是通过最陡梯度下降法等优化技术。需要计算最高。黄和陈[9]Lam和燕[13]都采用快速迭代方法通过贪心算法。蛇有一些缺点像轮廓往往成为被困在虚假的形象特征和另一个现实是,蛇是不适合在提取非凸特性。 |
1.2)可变形模板: |
可变形模板然后Yuille et al .[14]引入了考虑面部特征的先验和更好的蛇的性能。定位一个面部特征边界不是一项容易的任务,因为当地的证据面部边缘很难组织成为一个明智的全球实体使用泛型轮廓。低亮度对比周围的这些特性也使得边缘检测过程问题。Yuille等。[14]了蛇的概念更进一步的将眼睛的全球信息改进提取工艺的可靠性。可变形模板方法开发来解决这个问题。变形是基于当地的山谷,边缘,峰值,亮度[15]。除了面对边界,显著特征(眼睛、鼻子、嘴巴和眉毛)提取是人脸识别的巨大的挑战。 |
E = Ev + Ee + Ep + Ei + Einternal;电动车、情感表达、Ep、Ei Einternal外部能源由于山谷,边缘,峰值和图像亮度和内部的能量。 |
1.3)PDM(点分布模型) |
独立于计算机图像分析,和asm发达之前,研究人员研发了统计模型的形状[30]。我们的想法是,一旦你代表形状asvectors,您可以应用标准的统计方法对他们来说就像任何其他multivariateobject。这些模型学习容许星座的形状分训练examplesand使用主成分建立所谓的点分布模型。这些已经用于不同的方面,例如分类是铁器时代提出了[18]。 |
理想点分布模型只能变形的方式是对象的特征。傻瓜和他的同事们寻求模型,所以如果一个胡子,说,涵盖了下巴,形状模型\覆盖图像”近似的位置下的下巴胡子。因此自然(但也许只有在回顾)采用点分布模型。这个合成的思想从图像处理和统计形状模型导致了活动形状模型。第一个参数统计形状模型对图像分析的inter-landmark距离,提出了基于主成分傻瓜和泰勒[19]。在这种方法中,傻瓜,泰勒,和他们的同事,然后发布了一系列的论文,累积在我们所说的经典活动形状模型(20 - 24)。 |
2)低水平分析 |
基于低级视觉功能,如颜色、强度、边缘、运动等。 |
2.1)肤色基地 |
人脸的颜色是avital特性。使用肤色作为跟踪特征脸有几个优点。颜色处理处理其他面部特征要快得多。在一定的照明条件下,颜色取向不变。这个属性使运动估计更加容易,因为只有翻译模型所需的运动估计[25]。人脸跟踪使用颜色特征有几个问题像一脸的颜色表示相机获得的受多种因素的影响(环境光,物体运动,等等)。 |
主要是三个不同的人脸检测算法可以基于RGB, YCbCr,他的彩色空间模型。在算法的实现即有三个主要步骤。 |
(1)分类的皮肤区域在颜色空间中, |
(2)阈值应用到掩盖皮肤区域 |
(3)绘制边界框提取脸部形象。 |
克罗利和Coutaz[26]建议简单的肤色检测算法皮肤像素。人类感知的颜色变化的函数的相对方向照明。皮肤区域的像素可以检测到使用规范化的颜色直方图,并可以归一化强度除以亮度的变化。转换一个(R, G, B)向量转化为一个(R, G)向量的归一化提供了一个快速的肤色检测。这个算法失败当有一些更多的皮肤区域像腿,手臂等。 |
Cahi和颜[27]建议皮肤颜色与颜色YCbCr空间分类算法。研究发现,像素属于皮肤区域有类似Cb和Cr值。这样的阈值被选为[]内,由音乐厅和(Cb1, Cb2),一个像素分类是肤色如果值(Cr、Cb)的阈值。肤色分布给出了彩色图像的分。这个算法也有约束的图像应该只有脸皮肤区域。Kjeldson和Kender定义predicatein HSV颜色空间分离皮肤regionsfrom背景[28]。肤色分类inHSI YCbCr空间是一样的颜色spacebut这里负责值色调(H) andsaturation(年代)。类似于高于阈值被选中(H1, S1)和(H2, S2),和一个像素isclassified肤色如果值(H, S) fallwithin阈值和分布给thelocalized脸图像。类似于上面twoalgorithm这个算法也拥有相同的约束。 |
2.2)运动基地 |
当使用视频序列可用,运动信息可能被用来定位移动对象。Movingsilhouettes像脸部和身体部位可以extractedby简单阈值累积framedifferences [29]。除了脸部区域,面部featurescan位于帧差异(30、31)。 |
2.3)灰度基地 |
灰色信息内的脸也被视为重要的特性。面部特征如眉毛,学生,和嘴唇出现generallydarker比周围的面部区域。最近各种特征提取算法(32 - 34)searchfor分段面部区域内局部灰度极小值。在这些算法中,输入imagesare首先增强反差扩展和灰度形态学图书质量的当地肤色的例程,从而使检测更容易。darkpatches的提取是通过低层次的灰度阈值。基于方法和由三个层次组成。杨和黄[35]提出的新方法即面临灰度行为金字塔(马赛克)图像。该系统利用层次面位置由三个层次组成。高两层基于马赛克图像在不同分辨率。在较低的水平,提出了边缘检测方法。 Moreover this algorithms gives fine response in complex background where size of the face is unknown. |
2.4)边缘基地 |
介绍了人脸检测的基于边缘的酒井法子et al . [36]。这workwas基于线图分析面临的照片,旨在找到facialfeatures。嗉囊et al。[37]提出了一种分层框架基于酒井法子et al。swork跟踪人类头部轮廓。之后引人注目的作品是由许多研究人员在这个特定区域。方法建议Anila和Devarajan[38]非常简单和快速。他们提议框架由三个stepsi.e。最初图像增强采用中位数filterfor噪声去除和对比度调整直方图均衡化。在第二步中imageis由边缘增强的图像采用sobel算子。然后小说边缘trackingalgorithm应用于提取子窗口根据边缘增强的图像。进一步使用反向传播神经网络(症)算法分类sub-window脸或区别人脸。 |
3)特性分析 |
这些算法aimto发现即使thepose存在的结构特点,观点,或照明条件不同,然后使用这些定位人脸。这些方法aredesigned主要用于本地化。 |
3.1)功能搜索 |
3.1.1)琼斯中提琴的方法 |
保罗中提琴和迈克尔·琼斯为目标检测提供了一个方法,最大限度地减少计算时间,同时实现高检测精度。保罗中提琴和迈克尔·琼斯[39]提出了一个快速、健壮的人脸检测方法是15倍比任何技术发布的时候有95%的准确度约17 fps。简单的技术依赖于使用Haar-like特性评估快速通过使用一个新的图像表示。基于概念的A¢积分ImageA¢它生成大量的特性和使用促进学习演算法来减少overcomplete集和提高分类器的引入退行性树提供了健壮的和快速的干扰。探测器应用于扫描的方式,用于灰度图像,应用扫描窗口,也可以扩展,以及评估的特性。 |
3.1.2)伽柏特性的方法 |
谢里夫et al。[39]提出一个弹性群图映射(EBGM) algorithmthat successfullyimplements人脸检测使用伽柏过滤器。proposedsystem 40个不同的伽柏过滤器适用于在一个图像。因此其中40图像不同的角度和orientationare收到。接下来,最高强度分在每个filteredimage计算和他们标记为基准的点。该系统可以减少这些点按照距离淡薄。下一步是使用距离公式计算thereduced点之间的距离。最后,距离arecompared数据库。如果匹配,这意味着thefaces图像中检测到。伽柏过滤器[40]方程如下所示 |
” |
给出了方向, |
3.2)星座方法 |
到目前为止所讨论的所有方法都能够跟踪的脸,但还是有一些问题像定位面临着各种各样的姿势在复杂背景确实是困难的。减少difficultyinvestigator形成一组人脸面部特征的星座使用更健壮modellingapproaches等统计分析。提出了各种类型的脸星座节等。[41]。他们建立利用统计理论形状特征检测的多尺度高斯导数过滤器。黄等。[42]也应用高斯滤波器在一个框架基于图像预处理功能分析。 |
b图像基本方法 |
1)神经网络 |
神经网络获得更多的关注在许多模式识别问题,如OCR、对象识别和自动驾驶机器人。由于人脸检测可以视为两类模式识别问题,提出了各种神经网络算法。使用神经网络进行人脸检测的优点是系统培训的可行性来捕获复杂的类条件密度模式。然而,缺点是网络体系结构必须广泛调整(层数、节点数量、学习速度,等等)来获得特殊性能。在早期大多数分层神经网络提出了Agui et al . [43]。第一阶段有twoparallel子网的输入过滤强度valuesfrom原始图像。第二stagenetwork由输入输出的子网络andextracted特性值。在第二阶段的输出显示了inputregion面对的存在。探索和Samal发达最早的neuralnetworks人脸检测[44]。网络由四层1024输入单元,256台第一hiddenlayer 8第二隐层单元,两个outputunits。 |
伯尼尔Feraud和使用自动联想神经网络提出了一种检测方法[45],[46],[47]。这个想法是基于[48],显示了一个汽车联想网络五层能够执行一个非线性主成分分析。一个自动联想网络是用来探测前面看脸,另一个是用来检测面临了60度左右的额观点。之后,林等人提出了一个使用概率神经网络决定人脸检测系统(PDBNN) [49]。PDBNN的体系结构类似于一个径向基函数(RBF)网络学习规则和概率解释与修改。 |
2)线性子空间方法 |
2.1)特征脸方法 |
采用特征向量的早期例子认脸是由Kohonen[50]的simpleneural网络演示执行面临recognitionfor对齐和规范化的脸图像。Kirby和报告显示图像的脸可以线性编码使用中等数量的基础图像[51]。提出的观点可以说是1901年首次byPearson[52],然后由霍特林在1933年[53]。给定n×m像素的集合训练imagesrepresented作为向量的大小m X n,基向量spanningan优化子空间之间的均方误差,确定培训imagesonto这个子空间的投影和原始图像是最小化。他们叫的最优基向量Eigenpictures外国只是特征向量的协方差matrixcomputed矢量化的脸图像100年培训set.Experiments一组图片显示,一脸幅91 X 50像素可以有效地使用only50编码Eigenpictures,同时保留合理的相似(即。,捕获95%的方差)。 |
3)统计方法 |
3.1)支持向量机(SVM) |
支持向量机被介绍Osuna et al。[54]人脸检测。支持向量机作为新范式训练多项式函数,神经网络、径向基函数(RBF)分类器。支持向量机适用于感应原理,叫做结构风险最小化的目标最小化泛化误差的上界。一个支持向量机分类器是一个线性分类器的分离超平面预计选择最小化分类误差看不见的测试模式。在[54],Osunaet人开发一个高效的方法来训练anSVMfor大规模问题,andapplied人脸检测。根据两个测试集10000000测试模式的19个X 19像素,系统稍低错误率和运行approximately30倍系统通过演唱和小山[55]。支持向量机也被用来检测人脸和行人在小波域。 |
应用程序 |
人脸检测技术可以在广泛的有用的和必要的应用程序。如 |
o生物识别 |
视频会议啊 |
o人类——计算机交互 |
o访问控制系统 |
结论 |
人脸检测是目前一个非常活跃的研究领域,这项技术已取得了长足的进步。过去的几年里已经显示很大的进步在低质量等算法处理复杂环境和杂乱背景灰度图像。一些最好的算法仍过于昂贵计算适用或实时处理,但这可能会改变在计算机硬件的改进。介绍了各种基于众多特性和图像技术可用来检测人脸。所有方法都有自己的优缺点。此外使用基于图像的方法如神经网络、支持向量机、主成分分析、不确定性的特征在基于特征的方法可以很容易地解决。 |
引用 |
|