ISSN在线(2278 - 8875)打印(2320 - 3765)
……Vijayaragavan, R。Sakthivel, B.Karthik
|
相关文章Pubmed,谷歌学者 |
访问更多的相关文章国际先进研究期刊》的研究在电子、电子、仪表工程
在本文中,我们提出重量旋转技术高峰,平均功率比(地表铺面)降低OFDM系统。它是基于选定的映射(SLM)算法。传统的SLM技术的主要缺点是它的高信号处理复杂度由于使用多个逆快速傅里叶变换(传输线)操作/ OFDM块。在提出减少地表铺面是基于预设阈值和相序相应修改。仿真结果表明,这种技术给性能接近SLM技术以减少相当大的复杂性。
关键字 |
减少地表铺面,体重旋转技术,SLM。 |
介绍 |
通信是生存的基本需求和交互提供了一个交流的意思。自然,使用不同的通信方式等交互语言,眼睛,身体运动,面部表情,手势和姿势。手势是一种非语言交流用身体的一部分,用来代替语言交流(或结合)。手语是一种语言使用手势代替声音来传达意义结合手的形状,方向和手的运动,手臂或身体,面部表情和lip-patterns。手语是一种视觉语言,由三个主要组件[2]:手语:使用字母,字母拼单词,单词水平词汇:用于大多数的通信,非体力劳动特点:面部表情和舌头,嘴和身体的位置。手语是一种听力和语言障碍的交流方式。 |
手语识别(SLR)是一个多学科研究领域涉及模式识别、计算机视觉、自然语言处理和语言学[1]。此外对人机交互(HCI),相比传统的交互方法如键盘,鼠标,笔等,和基于视觉的交互更加自然和高效 |
手势分为两类,即静态和动态[3]。一些手势也有静态和动态元素,如符号语言[8]。静态手势的特点是由一个特定的手指的手的姿势thumb-palm配置和由一个单一的形象。动态手势是另一方面的特点是一个移动的初始和最终中风运动姿态。 |
相关工作 |
研究显示各种类型的系统和方法已经开发了手语识别。在识别系统获得数据可以获得“基于数据手套”或“基于愿景”方法。基于数据手套的方法使用传感器设备数字化的手和手指动作为不确定型数据[14]。这些方法可以很容易地提供精确坐标的手掌和手指的位置和方向,然而,和手配置设备非常昂贵,给用户带来多少麻烦经验。相比之下,基于视觉的方法只需要一个相机,因此被认为是容易,自然和基于手套的方法相比,成本更低的[7]。 |
提出了一种基于视觉的系统由Hienz等[5]从视频帧,提取特征向量识别262种不同信号的准确性达94%。规则的分类是基于单摄像机的图像通过使用模块化抓帧器系统。阴出版社[17]采用库仑能限制(远端控制设备)神经网络通过L * a * b颜色空间作为输入和输出训练层皮肤层类。Ranganath出版社[13]提出了手势识别系统,他们用毛皮商图像描述符作为他们的主要特征和分类RBF的帮助下。Ong出版社[12]发现与99.8%的准确率仅在灰度图像的形状信息;使用了级联分类器的中提琴出版社[15].Signers longsleeved穿深色衣服受到限制,在黑暗面前的主要背景。Hemayed出版社[4]开发了一种基于边缘的识别器阿拉伯手语使用普瑞维特边缘检测器提取分段手势的边缘。97%是通过使用欧氏距离分类的准确性。没吃出版社[11]培训监督前馈神经网络计算手指和找到方向用户点。基于视觉识别系统分类手势分为十类使用反向传播算法的准确性达89%在一个典型的测试集。 |
提出了一个简单而有效的识别系统将静态手势的美国手语转换成文本。手的几何属性转换为特征。神经网络用于识别和分类的任务。本文的其余部分将讨论系统的不同发展阶段:图像采集、图像处理、特征提取和分类。 |
提出的方法 |
模式识别系统设计的原则。模式识别是一个过程,需要原始数据,使操作基于模式的范畴。模式识别可用于分类,分配每个输入值赋给一个给定的一组类。系统的流程图,图1所示。 |
答:图像采集 |
在第一阶段一个图像从摄像头或从数据库中。系统从数据库中读取输入图像[6]包含RGB图像对美国手语的迹象。四个迹象的数据库包含样品由不同的用户穿长袖衣服。均匀背景的图像是黑暗与光明的颜色在不同的发光条件。图像数据库包含160图像。120图片:图片为每个符号是用于培训目的而剩余40图片:10图片为每个符号用于培训。 |
b .图像处理 |
处理执行使用三个步骤:颜色空间转换的皮肤区域提取、形态学操作来消除噪声和图像裁剪为便于特征提取。 |
1)皮肤区域检测:系统L * a * b空间肤色区域检测使用的阈值技术。L * a * b是彩色空间定义的CIE(国际照明委员会),基于一个通道的亮度(轻)(左)和两个颜色通道(a和b)。首先输入RGB图像转换到L * a * b *彩色空间分离成一个单一的平面图像的强度信息,然后计算在每一层的局部范围。皮肤颜色分类工作当色度组件用于分割,因此亮度分量被丢弃。使用阈值值,第二和第三层,它代表的色度分量转换为二进制图像。两个二进制图像然后相乘得到合成二进制图像仅包含手地区。各种形态操作,像开放扩张进行去除噪声从分段手地区。 |
2)图像裁剪:使用连接成分分析连接的合成图像区域标记。每个连接组件关联一个边界框提供尺寸裁剪矩形的手从输入图像区域。 |
c .特征提取 |
特征提取的基于形状的属性。Tanibata出版社[16]开发日本手语使用手功能定位、区域,手的平坦区域。穆罕默德出版社[9]提出的特征提取方法使用一些几何尺寸,如高度、宽度、面积等。使用regionprops图像特征提取和特征向量形成后将作为输入级的手势识别和分类的标志。 |
1。面积:计算白色像素的总数(即。二进制值“1”)。 |
2。重心=[圆(Σ(x代表白色像素)/区域),圆(Σ(y的值代表白色像素)/区域)]。 |
X c =Σξ/区域 |
x我代表图像的每个边界像素的坐标。 |
c =ΣY i /区域 |
y我代表图像的每个边界像素的坐标。 |
图像的质心(Xc、Yc)。 |
3所示。欧几里得的重心从原点的距离。考虑到两个点(x1, y1)和(x2, y2),这些点之间的欧式距离的公式: |
工具条最像素的坐标的二进制图像被认为是原点。如果图像是起源(0,0)然后质心之间欧式距离原点是由 |
4所示。平均高度的一个信号:标志的高度从二进制图像,0代表黑色像素,1代表的白色像素计算使用像素扫描方法[10]。 |
二进制图像计算的平均身高 |
平均身高= N / M。 |
其中N是黑色像素的总数(0)的图像和M的总数列包含至少一个黑色像素(0)。 |
最后,收集到的特征从上面的部分组合起来形成一个特征向量按照以下顺序: |
特征向量,V =(面积、x-centroid、y-centroid centroid-distance,平均身高) |
特征向量训练图像存储在垫子上文件的MATLAB和特征向量输入手势图像即测试图像在运行时计算。 |
使用神经网络d手势的分类 |
系统使用前馈反向传播网络的分类标志的手势。反向传播算法是一个监督学习算法训练的多层前馈神经网络。因为它是一种监督学习算法,输入和目标输出向量提供培训网络。如果有一个错误,感知器网络将重新调整权重值,直到没有错误或最小化,然后它会停止。每个通过输入向量称为时代。 |
输入向量1 x5特征向量所以只有5个输入神经元。定义的目标向量也对应于每一个手势。的性能与MSE培训评估,相关系数,即回归(R)之间的网络输出和相应的目标输出和训练的特点,验证和测试错误。成功的培训,设置一些条件。这些MSE设置为0.001,最大验证失败设置为6次,学习速率设置为0.05和时代的最大数量设置为1000。Sim函数是用来模拟模型。最后神经网络的输出转换成文本对应于每个分类手势。停止训练后21世纪以来验证错误增加了六倍多,如图2所示。培训、验证和测试的错误是在良好的条件下,在训练的特征集。 |
实验结果 |
提出系统的实施、图像创建数据库培训和测试图像。图像数据库包括四个静态手势的jpg格式的美国手语。 |
该方法使用MATLAB R2012a实现。皮肤区域检测、图像裁剪调整并使用图像处理工具箱进行特征提取。神经网络工具箱用于分类的手势。MATLAB函数(sim)模拟网络建成的。的行为(sim)以网络输入,网络对象,然后返回网络的输出。训练神经网络测试与测试图像数据库。 |
答:混淆矩阵 |
混淆矩阵已经绘制显示每个手势的识别精度,如图3所示。绿色框显示正确数量的图像分类和蓝色框显示总体识别率测试特定手势图像数据集。 |
b . GUI模拟结果(签署文本)。 |
用于测试的图片创建GUI(图形用户界面)。GUI由九个按钮。GUI提供了一种简便的方法给用户与系统进行交互。GUI显示系统的不同阶段:输入图像,手区域检测,特征提取的重心所示的手,最后用神经网络识别字符。GUI的一个例子是图4所示显示系统所涉及的不同阶段“V”的标志 |
结论 |
系统开发提供了一个简单而有效的手势识别方法使用几何特性的基础上,基于形状的属性。静态手势识别使用神经网络和转换成相应的文本。达到85%的识别率测试图像。在未来的系统可以扩展到动态手势识别现实生活应用程序在一个不受限制的环境中。 |
引用 |
|