关键字 |
神经网络,主成分分析,特征值,特征向量,反向传播神经网络 |
介绍 |
人脸识别有大量的应用,包括安全、个人验证、互联网通信和计算机娱乐。虽然自动人脸识别的研究从20世纪60年代就开始了,但这个问题在很大程度上仍然没有得到解决。近年来,由于人脸建模和分析技术的进步,这一领域取得了重大进展。人脸检测和跟踪系统已经开发出来,但可靠的人脸识别仍然给计算机视觉和模式识别研究人员带来了巨大的挑战。最近人们对人脸识别越来越感兴趣有几个原因,包括公众对安全的日益关注、数码世界对身份验证的需求,以及多媒体数据管理和电脑娱乐对人脸分析和建模技术的需求。自动化人脸分析、模式识别和机器学习的最新进展使得开发自动人脸识别系统来解决这些应用成为可能。本文提出了一种在约束环境下快速、简单、准确的人脸识别数学模型和计算模型。利用特征脸进行人脸识别已被证明是一种准确、快速的人脸识别方法。将bp神经网络技术与主成分分析相结合,可以很容易地识别非线性人脸图像。[1] [5] |
工作模型 |
系统包括三个步骤(图1): |
人脸识别系统(FRS)的设计与实现主要分为两个部分。第一部分是图像处理,第二部分是识别技术。图像处理部分由人脸图像采集技术组成,人工智能部分由主成分分析和反向传播神经网络组成。第一步通过网络摄像头、数码相机或扫描仪获取的人脸图像作为输入输入到主成分分析中,主成分分析将输入图像转换为低维图像并计算其欧氏距离。然后将该欧几里得距离作为反向传播神经网络的输入。 |
算法 |
A. PCA:主成分分析(PCA): |
主成分分析(PCA)是一种使用正交变换的统计方法。采用PCA方法,通过数据压缩基础来降低数据的维数,揭示出人脸模式最有效的低维结构。这种维数的减少消除了无用的信息,并精确地分解了人脸结构,其中涉及到将大量可能相关的变量转换为更少数量的正交(不相关)成分,称为主成分。每个人脸图像可以表示为特征脸的加权和(特征向量),这些特征脸存储在一个一维数组中。测试图像可以使用这些特征面加权和来构造。当给定一个测试图像时,通过将图像投影到特征人脸向量上来计算权重。然后比较测试图像的加权向量与数据库图像的加权向量之间的距离。因此,可以在特征人脸的帮助下重建原始图像,使其与期望的图像相匹配。 |
PCA算法: |
设图像的训练集为?1,?2...... ?M,集合的平均人脸定义为 |
|
每一个面都不同于平均值 |
|
我= 1…米 |
协方差矩阵由 |
|
矩阵A是由 |
|
然后对这组大向量进行主成分分析,寻找一组M个标准正交向量。为了获得单个特征脸对人脸图像贡献的权重向量W,通过简单的操作将人脸图像转换为其特征脸分量投影到人脸空间上 |
|
k = 1…M',其中M'£M是用于识别的特征脸的数量。权重形成向量W = [w1,w2,....wm],描述了每个特征脸在表示人脸图像方面的贡献,将特征脸作为人脸图像的基集。确定哪张脸能提供对未知输入面部图像的最佳描述的最简单方法是找到使欧氏距离€k最小化的图像k |
|
其中Wk是描述训练集中第k个人脸的权重向量。正是这个欧氏距离被作为神经网络的输入[9] |
B.反向传播神经网络(BPNN): |
反向传播算法是一个多层网络,使用基于sigmoid函数的权重调整,就像delta规则一样。根据反向传播网络(BPN)算法,是一种完全前馈的网络连接。激活沿一个方向从输入层传播到输出层,一层中的单元都连接到下一层中的每个单元。反向传播算法主要由网络的前向扫描和后向扫描两部分组成。前向扫描定义了从输入层到输出层的网络,它通过网络传播输入向量,最后在输出层提供输出。前向扫描时,网络的权值都是固定的。因此,向后扫描定义了从输出层到输入层的网络,它与前向扫描类似,只是错误值通过网络向后传播。这样做是为了确定在训练过程中如何改变权重,其中权重都是根据纠错规则进行调整的,其中网络的实际响应从目标响应中减去以产生错误信号。[10] |
在图2中,隐藏单元向各个输出单元发送激活,因此在向后扫描时,隐藏单元将接收到来自输出单元的错误信号。基本上,每一层中处理元素的数量将根据验证的应用程序而变化。 |
反向传播算法采用监督学习方法,目标输出向量提前在系统中定义。学习过程从BPN输入模式的随机变量开始。其中,净总投入使用产品的标准总和,定义如下式: |
|
基本上,单元有一个计算输出值的规则,该输出值将被传输到其他单元,其中该规则被称为激活函数,输出值被称为单元的激活。反向传播算法采用sigmoid函数作为激活函数,用式表示,其中f (netj)为隐含层的激活函数: |
f(净j) = 1\[1+exp(-netj)] |
为了求出净总产出,下面方程定义了适当的公式:净k= wk.f(净j) |
那么,隐含层和输出层的输出分别由方程确定,定义如下: |
Oj= f(净j阿)k= f(净k) |
输入模式实际上在整个网络中传播,直到产生输出模式。BPN基本上利用广义增量规则来确定误差。δ j表示所有隐层单元的误差,如下式所示;δ k表示所有输出层单元的误差,如下式所示: |
|
最后,每个单元稍微修改它的输入连接权重,以减少它的错误信号,然后对下一个模式重复这个过程。应用学习率η,隐层中某单元的权值变化为: |
|
而对于输出层,权值变化可由: |
|
反向传播的最后一步是使用下面的方程更新系统中的权重值。 |
|
流聊天实验 |
仿真结果 |
基于pca和bpnn的人脸识别测试结果: |
在MATLAB中对该方法进行了仿真。在ORL人脸数据库上进行了测试。这个数据库有一个以上的个人图像?在不同的条件下。数据库分为训练数据库和测试数据库两组。在训练数据库上对网络进行训练,然后将测试数据库中的一张图像作为输入来测试网络。 |
结论 |
研究表明,采用主成分分析进行特征提取,采用BPNN进行图像分类识别的人脸识别系统具有较高的准确率和较快的计算速度。采用主成分分析作为特征选择技术,可以降低空间维数。结合BPNN的主成分分析比单独的主成分分析效果更好,主成分分析是在系统性能的基础上完成的,系统性能是通过改变训练和测试人脸中每个受试者的人脸数量来衡量的。由于训练集中人脸图像的增加,识别性能有所提高。这是因为更多的样本图像可以更好地表征人脸空间中的主题类别。结果表明,该方法具有90%以上的接受率,且执行时间仅为几秒。 |
数字一览 |
|
|
参考文献 |
- http://murphylab.web.cmu.edu/publications/boland/boland_node17.html
- r·罗哈斯(1996),“神经网络简介, Springer-Verlag,柏林“IEEE神经网络汇刊。第一,vol.8 pp158 - 200
- 《模式识别与神经网络》,B.D. Ripley著,剑桥大学出版社,1996,ISBN 0-521-46086-7
- Mohammod Abdul Kashem,马里兰州Nasim Akthar,Mshamim Ahmed和Md. Mahbub Alam“基于主成分分析(PCA)与反向传播神经网络(BPNN)的人脸识别系统”IJSER vol.2,第6期,2011年6月ISSN 2229-5518
- 耆那教徒的《数字图像处理基础》,Prentice-Hall Inc., 1982。
- Rafael C. Gonzalez和Richard E Woods,“数字图像处理”,人物教育亚洲
- A. samal和P.A.Iyengar(1992):“人脸和面部表情的自动识别和分析:一项调查。模式识别”。
- m.a.t turk和a.p.t petland,(1991)“识别特征脸”,认知神经科学杂志。第3卷,第71-86页。
- K. Kim:基于主成分分析的人脸识别,印度国立理工学院,Rourkela, 2008
- S.海金,神经网络,综合基础,普伦蒂斯霍尔。第二版,199
|