在线刊号(2320-9801)印刷刊号(2320-9798)
Kannan萨勃拉曼尼亚 印度泰米尔纳德邦金奈巴拉特科学技术学院MCA部 |
有关文章载于Pubmed,谷歌学者 |
更多相关文章请访问国际计算机与通信工程创新研究杂志
针对人脸识别中经常遇到的高维小训练集问题,提出了一种基于径向基函数(RBF)神经分类器的通用高效设计方法。为了避免过度拟合,减少计算量,首先采用离散余弦变换方法提取人脸特征,因为主成分分析(PCA)人脸识别方法依赖于数据且计算量大。为了对未知的人脸进行分类,他们需要匹配存储的提取的人脸特征数据库中最近的邻居。本文采用离散余弦变换(DCT),通过截断高频DCT分量来降低人脸空间的维数。然后,为了避免保留光照等降维技术带来的不利影响,采用Fisher线性判别(FLD)技术对所得到的人脸特征进行进一步处理,以获得低维的判别模式。降维的主要目标是集中于重要信息,同时可以丢弃冗余信息。开发了各种减小尺寸的方法。降维方法可以分为线性降维和非线性降维。本文介绍了径向基函数神经网络在人脸识别中的应用,采用离散余弦变换进行特征提取和降维,尽管Fisher线性判别准则部分存在一些问题,但离散余弦变换在人脸识别中的应用非常成功。
介绍 |
人类比计算机更聪明。考虑到计算几百个八九位数字的和对计算机来说是一个微不足道的计算,对计算机来说很容易,但当我们遇到解决谜题的问题时,只有人脑在解决问题方面优于计算机。 |
对于视觉或语音识别来说,这是一个高度平行的问题,有许多不同的、相互冲突的想法和记忆。也许我们的大脑能够很容易地并行操作,所以我们把电脑远远甩在后面。 |
从这一切我们可以得出的结论是,我们试图解决的问题是非常相似的。神经计算的方法是捕捉大脑背后的指导原则。并将其应用到计算机系统中。在对大脑基本系统建模时,我们应该最终得到一个解决方案,它本质上适合于并行问题,而不是串行问题。这些并行模型应该能够以并行的方式表示知识,并以类似的方式处理知识,学习能力并不是生物界所独有的,而是在神经网络模型中捕获的。对于一台机器来说,一个好的概率解决方案需要一些时间,这是一个从经验中不断学习的缓慢过程,直到机器做出一个好的动作的概率超过了做出一个坏的动作的概率,这种强化学习类似于通过大脑发生的突触连接的效率提高,以促进神经事件的复发。 |
大脑擅长做我们希望计算机做的事情,比如通过学习例子来进行视觉、语音识别等。从静态和视频图像中识别人体面部的机器已经成为图像处理、模式识别、神经网络和计算机视觉领域的一个活跃的研究领域。从护照、信用卡、驾驶执照和面部照片等受控格式照片的静态匹配,到监控视频图像的实时匹配,在处理需求方面呈现不同的限制,这些应用广泛,激发了这种兴趣。尽管心理学、神经科学和工程学的研究,图像处理和计算机视觉已经被研究了一些与人类和机器人脸识别相关的问题。虹膜自动识别系统的设计仍然是一个难点,特别是在需要实时识别的情况下。 |
公众对电子交易的安全和隐私缺乏信任和信心,似乎是最严重的问题之一,也是主要因素之一。 |
?信用卡诈骗正成为一个主要原因。 |
?对于移动/无线和智能卡平台来说,检测和防止网络交易的欺诈性拒付是一项特别具有挑战性的任务,原因有很多。 |
?移动/无线和智能卡平台有很多原因。 |
问题公式化 |
面部识别系统是最古老的识别形式之一,它可以测量面部特征之间的距离或特征本身的尺寸等特征。大多数开发人员使用神经网络技术或面部几何形状的统计相关性。当数据库大小增加到数万个以上时,许多人都难以实现高水平的性能。造成这种困难的原因有两个方面: |
?面部图像是高度可变的,变化的来源包括个人外观,三维。 |
?(3-D)姿势、面部表情、面部毛发、化妆等都是不时变化的特征。此外,采集的光照、背景、尺度和参数都是在真实场景下采集的人脸图像中的变量。 |
问题分析 |
人脸识别问题可以分三步来解决。 |
?特征抽象和表示 |
?特征的歧视 |
?特征分类与识别 |
许多成功的人脸检测和特征提取范式已经被开发出来,常用的方法是使用几何特征,其中测量不同特征的相对位置和形状。同时,提出了几种使用人脸全局表示的范例,其中从输入的人脸图像中自动提取人脸的所有特征。研究表明,采用全局编码的人脸识别速度快。利用矩阵的奇异值分解从模式中提取特征。说明了图像的奇异值是稳定的,代表了图像的代数属性,是固有的,但不一定是可见的,提出了描述人脸特征的特征脸方法。关键思想是计算图像压缩的最佳坐标系,其中每个坐标实际上是一个图像,称为特征图。然而,主成分分析产生的投影方向使所有类别(即所有人脸图像)的总散射最大化。在选择投影时,使总散射最大化。PCA保留了由闪电、面部表情和所有其他因素引起的不必要的变化。因此,生成的特征并不一定有利于类之间的区分。 The face features are acquired by using the fisherface or discriminant eigenfeature paradigm. This paradigm aims at overcoming the drawback of the eigenface paradigm by integrating Fisher’s linear discriminant criteria, while retaining the idea of the eigenface paradigm in projecting faces from a high definition image space to a significantly lower dimensional feature space. The goal of ace processing using neural networks is to develop a compact internal representation of faces, which is equivalent to feature extraction, therefore the number of hidden neurons is less than that in either input or output layers, which results in the network encoding inputs in a smaller dimension that retains most of the important information. Then the hidden units of the neural networks serve as the input layer of another neural network to classify face images. |
RBF神经网络的显著特征如下: |
?它们是通用逼近器。 |
?它们具有最好的近似。 |
?它们的学习速度很快,因为它们有局部调节的神经元。 |
?它们具有比其他神经网络更紧凑的拓扑结构。 |
RBF神经网络通常被广泛应用于函数逼近和模式识别,但这些应用中的模式维数通常较小。当RBF神经网络应用于人脸识别时,系统具有以下高维特征。例如,一张128*128的图像将有16384个特征。 |
因此,人脸识别与经典的模式识别问题有本质上的区别,例如,在经典的模式识别问题中,类的数量是有限的,而每个类的训练模式是大量的。这种情况导致在设计RBF神经分类器时面临以下挑战。 |
1)过拟合问题:已有研究表明,如果网络输入的一个维度与训练集的大小相当,则系统容易产生RBF,导致泛化效果较差。 |
2)过度训练问题:网络输入的高维数导致优化处理复杂,收敛性低。因此,它很可能导致过度训练。 |
3)小样本效应:小样本很容易影响系统的设计和评价。对于具有大量特征的应用,复杂的分类规则训练样本量必须相当大。我已经进一步指出,样本量需要指数级增加,以便随着维数的增加对多元密度进行有效估计。 |
4)奇异问题:如果n小于r+1,样本协方差矩阵是奇异的,因此无论协方差矩阵的真值是多少都不可用。 |
为了避免上述问题,本文提出了一种系统的REF神经分类器设计方法,以处理高维特征向量的小训练集。 |
所提出的方法包括以下部分。 |
1.通过特征选择减少输入变量的数量,即,首先由PCA生成一组最具表现力的特征,然后实现FLD以生成一组最具鉴别性的特征,以便尽可能地分离不同类别的训练数据,并尽可能地压缩相同类别的模式。 |
2.提出了一种新的基于训练样本类别信息的聚类算法,实现了对同质数据的聚类,实现了混合数据有限的REF神经分类器结构紧凑。 |
提出了两个重要的准则来估计RBF单元的初始宽度,这两个准则控制着RBF神经分类器的泛化。 |
本文的其余部分组织如下: |
?在现有系统的特征提取部分尝试了离散余弦变换算法,以提高系统的性能。 |
?许多面部识别系统已经开发,并取得了不同程度的成功。最常见的这种系统是基于基于主成分分析的特征脸的概念。 |
主成分分析人脸识别方法依赖于数据,计算成本高。为了对未知病例进行分类,他们需要匹配存储数据库中外部面部特征的最近邻居。本文采用离散余弦变换的方法,通过截断高频DCT分量来降低面空间的维数。剩下的系数被输入一个神经元件。 |
1.离散余弦变换:离散余弦变换将信号从空间表示转换为频率表示。一般来说,低频比高频对图像的贡献更大。因此,如果我们使用DCT将图像转换为其频率成分,并丢弃大量关于更高频率的数据,称为DCT系数,我们可以减少描述图像质量所需的数据量。这被称为损失图像压缩,在JPEG和MPEG中被广泛使用,具有相当好的性能。当我们需要降低学习算法的输入空间的维数时,这就是可以发挥作用的东西。以下是NM尺寸图像的2D DCT公式,其中F(u,v)是点(u,v)处的DCT系数,对于u=0,1,N1, v=0,1,M1, F(x,y)是点(x,y)处的原始强度y v N xM y NM2 1 2 cos 2 1 2 0 10其中=否则对于C, 1 0, 2 1 a 2D DCT .........网络进行分类。由于使用了少量的系数,与其他方法相比,我们基于DCT的人脸识别方法非常快。 |
2.降维:离散余弦变换类似于傅里叶变换,使用正弦基函数。不同之处在于余弦变换基函数并不复杂,因为有快速算法来计算2D DCT,并且只使用少量的系数,我们基于DCT的人脸识别方法与其他方法相比非常快。 |
特征面方法也用于特征提取,目的是计算图像压缩的最佳坐标系。特征脸方法的缺点是它保留了不必要的信息,如照明面部表情,也因为这不仅是识别成为一个问题,效率也降低到50%。 |
它计算图像压缩的最佳坐标。这些协调包括最具表现力的特征,类似于PCA的输出。 |
主成分分析理论 |
主成分分析是统计模式识别和信号处理中常用的数据约简的标准技术。统计模式识别中的一个常见问题是特征选择或特征提取。特征选择是指将数据空间转换为特征空间的过程,理论上特征空间的维度与原始数据空间完全相同。主成分分析的主要目的是降维。 |
主成分分析使方差的降低率最大化。我们计算输入数据向量的相关矩阵的特征值和特征向量,然后将数据正交投影到属于主导特征值的特征向量所张成的子空间上,数据表示的方法通常称为子空间分解。 |
算法 |
?获取整数的人脸图像。 |
?把它转换成一个向量。 |
?转置。 |
?求出协方差矩阵它是向量和ts转置的乘积。 |
?求出特征值和特征向量。 |
?通过选择最大特征值对应的列来找到特征向量。 |
?该特征向量由方差较小的频率分量组成。 |
?求特征向量的转置与图像矩阵的乘积。 |
径向基函数理论 |
在径向基函数中,我们更倾向于高斯类型,因为它是可分解的。曲线的宽度足够大,可以进行最佳分类。 |
隐藏节点选择 |
?RBF方程的类型。 |
?表示的几何特征的类型。 |
?提出的学习方案为RBF。 |
?设置输入数量=2。 |
?初始化协议。 |
?更新径向基函数的宽度。 |
?初始化网络的权重。 |
?储存最终重量。 |
?重复与输入数量相等的循环。 |
因此,径向基函数提供了一种有效的学习算法,并作为一个良好的分类器。 |
离散余弦变换 |
DCT是图像压缩中用于计算图像坐标系的一种变换。它被证明是对方差的最佳压缩。在图像中,它也具有代替karhunenloeve变换的性质。 |
kl变换与kl变换的DCT特征的比较 |
KL变换依赖于数据的统计量。用可分离函数对图像自相关建模的优点是,与以往求解n2*n2个矩阵特征值问题相比,只有两个n*n个矩阵特征值问题需要O(n3)次计算,可分离模型实现了O(n6)/O(n (3)=O/n的降维,这是非常显著的。KL变换依赖于统计数据以及图像的大小,变换矩阵是计算出来的,用于执行变换的运算对于图像来说是相当大的。 |
结论 |
首先通过PCA范式提取人脸特征,从而使结果数据得到显著压缩。通过FLD方法进一步压缩信息,基于我们提出的方法的数据分布训练模式如详细结果所示。 |
1.随着特征维数的减小,类重叠逐渐减少,但PCA和FLA方法的聚类误差减小。 |
2.主成分分析的聚类误差随特征维数的减小而增大,主成分分析和FLD分析的聚类误差随特征维数的减小而减小。 |
3.PCA和FLD的数据仍然是重叠的,没有完全分离,除非特征小于20,闲置FLD缓解了类重叠。 |
4.因此,所提出的系统与离散余弦变换和主成分分析一起有效地运行。 |
参考文献 |