ISSN在线(2320 - 9801)打印(2320 - 9798)
Kannan萨勃拉曼尼亚 MC, Bharath研究所的科技、钦奈,印度TamilNadu |
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际期刊的创新在计算机和通信工程的研究
最富有表现力的方式显示人类的情感是通过面部表情。面部表情识别方法的目的是建立一个系统,从静态图像自动分类的面部表情。面对区域是首先将自动分成小区域,局部二值模式(LBP)的直方图是直方图提取并连接成一个单一的特性,有效地代表面部表情——愤怒、厌恶、恐惧、幸福和中性。获得最佳的识别性能通过使用支持向量机分类器(SVM)枸杞多糖的特性。图像都是取自JAFFE数据库进行实验。
关键字 |
||||
局部二进制模式(LBP),面部表情识别(带)、支持向量机(SVM) | ||||
介绍 |
||||
面部表情识别 | ||||
带系统是基于机器学习理论;精确的分类任务。分类器的输入是一组功能,这在前一个阶段从脸区域检索。特征形成的集合来描述面部表情。分类需要监督训练,训练集应该包含标记数据。一旦训练分类器,它可以识别输入图像通过分配一个特定的类标签。最常用的面部表情分类完成的操作单元,提出了面部动作编码系统和普遍的情绪:快乐、悲伤、愤怒、惊讶、厌恶和恐惧。有很多不同的机器学习技术的分类任务,即:再邻居、人工神经网络、支持向量机、隐马尔科夫模型、专家系统和基于规则的分类器,贝叶斯网络或提高技术(演算法,Gentleboost)。 | ||||
分类任务的三个主要问题:选择好的特性,有效的机器学习技术和不同的数据库进行训练。特性集应该由功能歧视和特定的特征表达。机器学习技术是选择通常的特性。最后,数据库用作训练集应该足够大,包含各种数据。提出的方法在文献中描述的类别的分类输出。 | ||||
车内的目的是模仿人类的视觉系统在最相似的方式。这是非常具有挑战性的任务不仅在计算机视觉领域,因为它需要高效的图像/视频分析技术也适合特征向量用于机器学习的过程。 | ||||
相关工作 |
||||
自动分析的面部表情认为面部影响(情感)推理从面部表情和面部肌肉动作检测。[1]。径向基函数网络(RBFN)和多层感知器(MLP),这两种神经网络模型描述了自动化的面部表情识别方法。人工神经网络(ANN)可用于数据库面临的描述符是用作输入训练网络。[2]。前馈反向传播神经网络作为分类器分类提供脸部的表情了七个基本类别,如意外,中性,悲伤、厌恶、恐惧、高兴和愤怒。前馈反向传播神经网络用于识别面部表情。100%的准确率达到训练集和测试集精度达到95.26%的JAFFE数据库。[3]。枸杞多糖是最好的操作符提取面部特征和MANFIS用于识别面部表情。这项工作是有用的人类情感等现实问题的分析,humancomputer交互,监测和网络会议和娱乐。[4]。研究的主要贡献是面部表情识别基于静态图像,提出一种新的识别方法使用特征空间[5]。支持向量机(SVM)的RBF内核作为分类器在我们的工作。全球外观特性是通过执行基于零空间的线性判别分析培训脸上图像[6]。光流计算结果通过使用卡尔曼滤波处理。神经网络用于一组训练图像和测试的脸。 the Kalman filter to the neural network lead to a recognition rate of 70%. However, by applying the proposed statistical approach on the optical flow results and feeding it to the neural network lead to an improvement to 80% [7]. Laughters are classified into the following three categories: laughter of pleasantness, laughter of sociability, and laughter of unpleasantness. The rate for the smile of pleasantness rose with increasing delay, and the rate for the smile of unpleasantness rose with decreasing delay [8]. Eigen faces for each class are used to determine class-specific masks which are then applied to the image data and used to train multiple, one against the rest, SVMs. The performance across databases is indicative of the method’s robustness to variations in facial structure and skin tone when recognizing the expression [9].One of the lesser known uses of facial expression in human interaction is signed communication, i.e., “sign language.” Sign language provide lexical, adverbial, and syntactic information[10]designed to obtain a high discriminating power for its low-dimensional embedded data representations in an effort to improve the performance on facial expression recognition. | ||||
DKLLE不仅让米歇尔和SLLE,一个明显的改善也优于其他使用方法包括主成分分析,LDA, KPCA, KLDA [11]。头构成分类器和造成依赖的面部表情分类器训练使用多层次支持向量机[12]。 | ||||
特征提取使用本地二进制模式 |
||||
基本局部二进制模式运营商引入Ojala et al .,是基于假设纹理有本地两个互补的方面,一个模式及其强度[6]。在工作中,提出了枸杞多糖作为两级版本的纹理单元来描述当地的结构模式。的原始版本本地二进制模式操作符在一个3×3像素的图像块。这个块的像素由其中心像素值阈值,乘以2的指数,然后总结获得一个标签为中心像素。 | ||||
社区由8个像素,共有28个= 256个不同的标签可以根据获得的相对灰度值的像素中心和社区。图1给出了一个说明的基本LBP算子。 | ||||
枸杞多糖使用8像素在一个3×3像素块,这个泛型配方的运营商将没有限制社区的大小或采样点的数量。下面的推导过程通用的枸杞多糖,考虑一个单色的图像 | ||||
我(x, y)和肾小球囊性肾病注意任意像素的灰度(x, y),即gc =我(x, y)。 | ||||
此外,让加仑日注意采样点的灰度值在一个等间距的圆形的P采样点和半径 | ||||
在点(x, y): | ||||
假设图像的局部纹理我(x, y)的特点是灰色的联合分布 | ||||
值P + 1 (P > 0)像素: | ||||
没有信息丢失,可以减去从社区中心像素值: | ||||
在下一步的联合分布是近似假设中心像素的统计独立的差异,使得分解的地理分布: | ||||
t (gc)是第一个因素强度分布在我的(x, y)。o角度分析当地的结构模式,它包含任何有用的信息。相反,联合分布的差异 | ||||
可用于局部纹理模型。然而,这个多维分布的可靠估计的图像数据是很困难的。提出一个解决这个问题的,Ojala等人,是应用矢量量化。他们使用学习矢量量化码书的384码字降低高维特征空间的维数。指数的384码字对应直方图的384箱。因此,这种强大的运营商基于灰度差异可以被视为一个文本签署运营商,像一些最近的方法基于图像补丁范例(例如)。基于学习矢量量化的方法仍有某些不幸的属性,使其使用困难。首先,gp−gc的差异是不变的图像的平均灰度值的变化而不是其他灰色的水平变化。第二,为了使用它纹理分类码必须是类似于其他文本根据训练方法。为了缓解这些挑战,只有分歧的迹象是: | ||||
(z)的阈值(步骤)函数吗 | ||||
通用的本地二进制模式操作符来自这个联合分布。对于基本的枸杞多糖,通过求和阈值的差异 | ||||
实际上,Eq。2.10意味着一个社区的差异的迹象解释为P位二进制数,导致2 P枸杞多糖的不同值的代码。当地的灰度分布,即纹理,因此可以近似描述2 p本离散分布的枸杞多糖代码: | ||||
在计算LBP P, R分布(特征向量)对于一个给定的 | ||||
N×M图像样本(xc∈{0,。yc∈N−1}, {0,。。M−1}),中央部分是只考虑因为不能使用一个足够大的社区边界。枸杞多糖代码计算每个像素的裁剪部分的图像,和代码的分布作为特征向量,用S: | ||||
S = t (LBPP R (x, y)), x∈{_R_。。。1,N−−_R_}, y∈{_R_,。1,M−−_R_} (2.12) | ||||
原始LBP非常类似于LBP8, 1,有两个差异。首先,附近的一般定义是循环索引,使其更容易得到旋转不变纹理描述符。第二,对角3×3附近的像素插值在枸杞多糖8中,1。 | ||||
由于其辨别力和计算简单,LBP纹理的运营商已经成为一个受欢迎的方法在不同的应用程序。LBP算子检测到许多不同的纹理基元,它可以实时分析图像设置。 | ||||
表情识别 |
||||
分类的支持向量机是一种流行的技术。支持向量机执行隐式数据在高维特征空间的映射,线性代数和几何可用于单独的数据只在输入空间可分与非线性规则。 | ||||
给定一个训练集标签的例子 | ||||
新的测试数据x是分类由以下功能: | ||||
哪里Largrange乘数的双重优化问题,然后呢 | ||||
SVM发现线性分离超平面的最大利润率将训练数据在特征空间。b是参数的最优超平面。 | ||||
支持向量机允许特定于域的核函数的选择。尽管拟议的新内核,最常用的核函数是线性的,多项式和RBF内核。SVM是二进制的决定。One-Versus-Rest方法使用,结合N - 1 N类为一个类,火车在其余的类。多层次分类是通过一连串的二进制分类器一起投票方案。 | ||||
数据乍一看 |
||||
|
||||
引用 |
||||
|