光标通过手势控制的计算机系统

普拉文·R Futane¹,r . v . Dharaskar博士²和v . m . Thakare博士³

PG计算机工程系,Amravati大学,印度马哈拉施特拉邦
计算机工程系,MPGI组机构,nand闪存,印度马哈拉施特拉邦
PG计算机科学系,Amravati大学Amravati,印度马哈拉施特拉邦

文摘

人类的交流主要是通过视觉和声音;因此,人机界面更加直观,如果使用更多的视觉和音频识别。另一个优势是,用户不仅可以交流从远处看,但是需要没有物理接触电脑。雷竞技网页版但是,与音频命令,视觉系统将比在嘈杂的环境中或在声音的情况下会造成干扰。手势识别可以被视为一种电脑开始理解人类的肢体语言,因此构建一个丰富的机器和人类之间的桥梁比原始文本用户界面甚至gui(图形用户界面),仍然限制大多数鼠标的输入。在这篇文章中,我们已经确定了一个替代鼠标命令尤其是引用游标控制应用程序。两个应用的情况;一个手势和另一个通过免提接口即脸姿态与凸包等算法,讨论了支持向量机和基本的数学计算。他们应用了给命令和执行的活动,如打开任何记事本办公工具软件使用手势而不是使用鼠标。系统测试时不同人的手势和闪电条件给予合理的结果在手势/动作元素的识别和跟踪。 Then those identified gestures are applied to application designed. At last, the results obtained convey us that there is a good alternative to mouse that is by using gestures.

关键字

手势,凸包,支持向量机。

介绍

当前的计算机技术已经进化设想先进的机械世界,在人类生命的增强是由人工智能。事实上,这已经促使一个活跃的发展趋势在机器智能,计算机视觉,人机交互为例,旨在复制人类的视觉。计算机使用的几乎所有的人在他们的工作或在他们的业余时间。特殊的输入和输出设备设计多年来与宽松的目的之间的通信计算机和人类,最著名的两个是键盘和鼠标。每个新设备可以被视为企图让电脑更聪明,使人类能够执行更复杂的与计算机通信。这有可能由于结果导向的工作由计算机专业人士创建成功的人机接口。

人机交互(HCI)是研究、规划和设计的人(用户)和计算机之间的互动。通常被认为是计算机科学的交叉,行为科学、设计和其他的研究领域。用户和计算机之间的相互作用发生在用户界面,包括软件和硬件;例如,显示的字符或对象软件在个人电脑的显示器,输入收到通过硬件外围设备,如键盘和鼠标,用户和其他用户交互与飞机等大型计算机系统和发电厂。所以本文主要侧重于沟通的另一种模式通过手/脸的手势。本文组织如下。下一节简要背景的光标控制应用程序通过手势后跟两个案例研究;一个处理手势和其他通过手势与他们的架构,方法/算法和实现细节。结果从应用程序的角度讨论了研究结论紧随其后。

动机和背景

没有提交或出版费用。人类的交流主要是通过视觉和声音,因此,人机界面更直观,如果它让使用更多的视觉和音频识别[1]。另一个优势是,用户不仅可以交流从远处看,但是需要没有物理接触电脑。雷竞技网页版但是,与音频命令,视觉系统将比在嘈杂的环境中或在声音的情况下会造成干扰。手势识别可以被视为一种电脑开始理解人类的肢体语言,因此构建一个丰富的机器和人类之间的桥梁比原始文本用户界面甚至gui(图形用户界面),仍然限制大多数鼠标的输入。点击的方法是基于图像密度,并要求用户将鼠标光标在所需的位置很短的一段时间。单击鼠标按钮是通过定义一个实现屏幕点击发生[1],[2],[3]。参考[5]只用指尖控制鼠标移动和点击。这里我们提出两个应用案例,参照光标控制计算机系统有两个手势的不同方面。一个使用与„„手界面”和另一个免提界面的人机交互中是一个辅助技术,主要目的是为残疾人的使用。

手-界面的应用程序,它强调通过手势没有光标控制鼠标/键盘的使用,但使用手势执行类似的活动。免提接口将帮助他们使用他们的自愿的运动,像头部动作,控制计算机和通信通过定制教育软件或表达建筑项目。实现这一点的方法之一是用摄像头捕捉所需的特性和监视其行动以翻译与计算机进行通信的一些事件。在我们的应用程序中我们使用的是面部特征与计算机进行交互。鼻子尖选为定点设备;这一决定背后的原因是鼻子的位置和形状;因为它位于中间的脸更舒适的使用功能,移动鼠标指针,定义其坐标。眼睛是用来模拟鼠标点击,所以用户可以火事件他眨眼。它将帮助他们使用自愿的运动,像头部动作;控制计算机和通信通过定制教育软件或表达建筑项目。 People with severe disabilities can also benefit from computer access to take part in recreational activities, use the Internet or play games. This system can also be chosen to test the applicability of „Hands-free Interface‟ to gaming, as it is an extremely popular application on personal computers.

这项工作的目的是为了让用户更自然地与计算机进行交互的简单的手/脸手势移动鼠标并执行任务。任何一个熟悉电脑和相机应该能够充分利用这份工作。

应用案例研究——我:光标控制通信方式通过手势

答:介绍

在手势识别手势起到至关重要的作用。这部分强调对手势的使用在控制计算机系统通过执行简单的命令,而无需使用传统控制装置模式如鼠标或键盘。在此系统中,第一个输入图像捕获和预处理后将其转换为二进制图像从背景中分离的手。然后中心计算和计算计算半径的手。指尖点是使用凸包算法来计算。所有使用手势控制鼠标移动。

一旦我们从摄像头获取图像,图像从RGB颜色空间转换为YCbCr如图1所示。然后,我们定义一个范围的颜色„肤色”,这些像素转换成白色;所有其他的像素转换为黑色。然后,背的中心区域的计算。手一旦确定,我们找到最适合本地区的圆,这个圆的半径乘以一些价值获得最大程度的„没有所指区域”。二进制映像的一方面,我们把每个手指的凸壳顶点。从顶点和慢跑的距离,我们获得积极的手指的位置。然后通过扩展任何一个顶点,我们控制鼠标移动。

认识到,一个手指手掌区域内,我们使用一个凸包算法。基本上,凸包算法是用来解决发现的问题最大的多边形包括所有顶点。该算法使用这个特性,我们可以检测到指尖的手。我们将使用该算法来识别是否手指折叠。认识到这些国家,我们增加2倍手半径值并检查中心和一个像素之间的距离在凸包集。如果距离超过的半径的手,然后一个手指传播。此外,如果两个或更多的有趣的观点存在于结果,然后我们把最长的顶点食指和手势时点击结果顶点的数量是两个或两个以上。凸壳算法的结果有一组包括所有顶点的顶点。因此有时一个顶点附近放置其他的顶点。这种情况发生在指尖的角落。为了解决这个问题,我们删除一个顶点的距离小于10像素当与下一个顶点。 Finally, we can get one interesting point on each finger

b .算法

手的凸包算法检测和手势识别是用在许多有用的应用程序。皮肤颜色可以更有效地分化YCrCb比RGB颜色模型,这个模型比和HSV。更高效的检测,实现背景减法算法用于区分皮肤像对象和真正的颜色。最初,一帧捕获只有场景中的背景,之后,每帧捕获,每个像素在新框架相比,其相应的初始帧,如果他们通过某个阈值根据特定算法计算,那么这个像素被认为从人体,它将在一个新的帧与原来的颜色。如果这个像素低于阈值,那么这两个像素被认为是相同的工作,他们被认为是背景所以对应的像素将零颜色在第三帧。重复所有帧后的像素,现在我们将有一个新的框架,只有一个人出现,和所有的背景颜色为零。

现在我们有发现手如图2和图3所示,我们已经应用在这一方面对象一个高效的手势识别算法,画了一个凸包的手对象,船体和有缺陷的数量,如果没有发现的缺陷,那么它是一个封闭的手,如果五发现的缺陷,然后有五个手指挥舞,等等。

c . GUI和实现细节

我们实现了这个应用程序使用OpenCV库[6、7]。在GUI中,我们提供了三个命令模式,如图4所示。使用的命令如下简要描述:

o应用程序启动模式——它是用来启动或运行各种应用程序,如记事本,Microsoft Word和命令提示符等。

o鼠标移动模式,这个模式支持鼠标操作,例如双击、右键、光标移动等。

o系统控制方式——这是用来控制系统关闭,注销和系统重启活动。

应用案例研究- II:光标控制通信方式通过免提手势

答:介绍

在这种情况下我们展示应用程序控制计算机系统彻底的手势。在这里我们使用支持向量机(SVM)。

支持向量机(svm)[11]是一个受欢迎的机器学习方法分类、回归,和其他学习任务。它是一种新型的最大利润分类器。LIBSVM是一个包作为支持向量机的库开发的。因此LIBSVM的库支持向量机(svm)。模板匹配的人脸检测过程中使用这个数据库。Libsvm所有必要的信息存储在“模式”创建的文件培训。它知道内核和参数使用。你只需要提供模型文件和测试数据。支持向量机(SVM)模型是一个表弟接近古典多层感知器神经网络。使用核函数支持向量机的多项式的另一个训练方法,径向基函数和多层感知器分类器网络的权重被发现通过求解线性约束的二次规划问题,而不是通过求解非凸,无约束极小化问题,在标准神经网络训练。 In the parlance of SVM literature, a predictor variable is called an attribute, and a transformed attribute that is used to define the hyperplane is called a feature. The task of choosing the most suitable representation is known as feature selection. A set of features that describes one case (i.e., a row of predictor values) is called a vector. So the goal of SVM modeling is to find the optimal hyper plane that separates clusters of vector in such a way that cases with one category of the target variable are on one side of the plane and cases with the other category are on the other size of the plane. SVM takes as an input training data samples, where each sample consists of attributes and a class label (positive or negative). The vectors near the hyper plane are the support vectors or in other words the data samples that are closest to the hyper plane are called support vectors.

使用b基本术语

下面给出了基本算法中使用的术语

1)SSR过滤器:

SSR过滤器代表:六个分段矩形过滤器[12]如图5所示

的总和pixels2在每个部门都表示为年代随着部门数量。

2)整体形象:

为了方便SSR过滤器的使用一个中间图像表示称为积分图像使用如图6所示在这表示积分图像位置x, y包含像素的总和上方和左侧的像素x, y和它的计算没有每个部门的像素图7所示。

3)支持向量机:

SVM训练数据作为输入样本,每个样本的属性和类标签(积极或消极)。离超平面最近的数据样本被称为支持向量。定义的超平面平衡其积极和消极的支持向量之间的距离,以获得最大利润的训练数据集,使用支持向量机来验证之间的„眼睛”模板。

4)肤色模型:

人类皮肤像素值之间特定的固定值。发现皮肤颜色模型735像素样本提取每个771脸图像从一个数据库。从这些样本皮肤像素的阈值设置为确定是否一个像素是皮肤像素。

人脸检测算法

一个好的人脸检测机制[8]中讨论,[9],[10]和[12]。概述是描绘在图8所示

参照以上,主要算法流程描述如下:

1)找到面对候选人:

找到面对候选人SSR过滤器将用于以下的方式,图9所示:

1.1计算积分图像通过一个经过视频帧使用方程:

s (x, y) = (x, y-1) + i (x, y)

二世(x, y) = 2 (x - 1, y) + s (x, y)

1.2地方左上角的SSR过滤每个像素的图像只在过滤器完全落在像素上的形象。

1.3地方SSR过滤器,因此在理想的位置眼睛落在行业S1和S3,虽然鼻子部门S5如图9所示。

1.4每个位置检查条件的方程:

S1 < S2

S2 > S3

S1 < S4 & & S3 < S6

1.5滤波器的中心将被视为面临候选人是否满足条件。

2)集群面临的候选人:

所使用的聚类算法如下:

2.1通过图像从左上角到右下角;对于每一个面对候选人fc:

·如果所有邻居都不是fc面临候选人分配一个新的标签。

·如果其中一个邻居是一个面对候选人分配fc的标签。

·如果有几个邻居的脸候选人分配标签的其中一个俱乐部,让注意标签是相等的。

2.2后首先通过我们将每组做的另一个指定的标签一个独特的标签,所以最终标签将成为集群”标签。

2.3设置足够大的每个集群中心与以下方程:

x =[Σx (i)] / n

y =[Σy (i)] / n

3)找到学生的候选人:

为了提取耳背式模板我们需要找到学生”候选人,所以对于每个候选人脸集群:

3.1中心集群SSR过滤器的中心。

3.2发现像素属于黑暗的区域通过binarizing部门与某个阈值。

3.3如果阈值只产生一个集群,集群的计算部分的面积,降低一半的部门,如果是超过指定阈值那么低的中心部分是其他学生一样的将被应用到上半部分,否则忽略部门和没有找到学生。

3.4如果有多个集群:

——找到最大的集群、黑暗和接近最黑暗的像素。如果向左或向右的学生候选人没有找到,跳过集群。

4)提取耳背式模板:

后发现学生”候选人为每个集群耳背式模板是为了通过提取支持向量机。提取后的模板我们规模与特定规模如何,我们得到一个模板,模板大小和对齐的培训。

4.1发现规模率(SR)除以23日左右学生候选人之间的距离(距离左和右学生训练模板)。

4.2提取模板大小35老* * 21 * SR

5)分类模板:

5.1通过提取支持向量机的模板。

每一个积极的结果乘以5.2集群的区域,其代表的模板。

5.3如果所有分类结果是负面的重复的人脸检测过程与一个较小的SSR过滤器的大小。

5.4选择最高的结果作为最终的脸,发现两个学生”候选人,被用来提取模板,结果将被设置为发现的眼睛。

6)发现鼻子提示:

6.1提取感兴趣的区域(ROI)。

6.2定位nose-bridge-point(平衡)ROI利用SSR过滤器有宽度与眼睛之间的距离的一半。

6.3 SSR滤波器的中心是平衡的候选人如果中心部门比行业:

S2 > S1

S2 > S3

7)霍夫变换:

霍夫变换是用于我们的眉毛检测算法。假设我们有一组点,我们需要找到一条直线,可以尽可能多的这些点。在霍夫变换直线有两个属性:Θ和τ

检测直线经过的点集,霍夫变换算法的步骤:

每个点的设置:

1。发现从这个点的线。

2。找到每一行的Θ和τ。

3所示。每一行:

o如果它已经存在(有相同的Θ和τ的一条线,并从另一个角度)增加计数器加1。

啊,如果它是一个新行;创建一个新的计数器和分配值1。

d .脸跟踪算法

1)设置ROI特征:

的位置跟踪功能在过去两帧(时刻t - 1和2)是用来预测当前帧的位置(在时刻t),计算值特性的转变”年代模板框架2和t - 1之间,和转变特性”年代ROI的当前帧特性”年代的最后一位(t - 1)帧转移价值。ROI的位置设置在某种程度上,它完全停留在视频帧的边界。

2)模板匹配:

特性的新位置被发现在ROI。窗口的功能模板大小是扫描在ROI和之间的SSD(平方差异之和)计算模板和当前窗口。后扫描整个ROI的窗口选择最小的SSD的模板”比赛,和它的位置被认为是功能”的新位置。为了实现更快的结果;计算SSD时,如果它的值仍小于最小的SSD,到目前为止,我们继续计算;否则我们跳到下一个窗口在ROI,因为我们确信当前SSD不会是最小的一个。

•选择特征的模板匹配

在每一帧应用模板匹配特性”年代首先从上一帧模板和模板;这种方式与第一个模板的匹配将确保我们正在跟踪正确的特性(例如,如果它重新出现在一个阻塞),至于与前一帧的模板匹配,它确保我们仍然跟踪相同的功能作为其状态改变。

•跟踪鼻子尖鼻子尖将通过模板匹配跟踪在ROI。

•检测眉毛

检测眉毛眼睛上方的小区域”年代预期位置和阈值,因为该地区高于眼睛只包含眉毛和额头,阈值会导致点代表了眉。发现眉线设置的阈值点使用霍夫变换。

•运动检测

检测运动在一定区域减去的像素区域相同的前一帧的像素,并在给定的位置(x, y)如果减法的绝对值大于某个阈值,我们考虑一个运动像素。

•眨眼检测

检测一个眨眼我们应用运动检测的眼睛”年代ROI;如果在ROI运动像素的数量大于某个阈值我们认为一个眨眼检测因为如果眼睛仍然是,我们检测一个运动的眼睛”年代的ROI,这意味着眼睑正在这意味着眨了眨眼。

•眼睛跟踪

达到更好的眼睛跟踪结果我们将使用耳背式(跟踪)稳定的特性,作为我们的参考点。在每一帧定位耳背式和眼睛后,我们计算的相对位置的眼睛耳背式;在下一帧后定位耳背式我们假设眼睛让他们的相对位置,所以我们把眼睛”roi的相对位置到新耳背式(当前帧)。发现眼睛的新模板的ROI我们结合两种方法:第一次使用的模板匹配,第二搜索最黑暗的ROI区域(因为眼睛瞳孔是黑色的),然后我们使用意味着两个发现坐标之间的眼睛”年代的新位置。

大肠GUI和实现细节

1)等待GUI框架:

这是框架将会显示当用户运行应用程序。等待屏幕光标和等待图12所示为系统后台正在处理。

2)主要GUI框架:

图13是主要的应用程序的GUI。后等待这帧显示只有所需的网络摄像头连接和检测。如果应用程序运行时找不到所需的摄像头将显示一条错误消息。这个框架由一个视频捕捉空间,用户的视频被捕获。它由四个不同的4个按钮功能:

 Detect Face-This 按钮将捕获用户的视频和屏幕将会显示检测到的脸 eyes, 等功能的鼻子这些特性是由黑色矩形对用户可见。的特性也会不时地发现用户动作。所以预计用户不做快速运动后,人脸检测,如图14所示。

 Enable Visage-This 按钮将为用户提供一个小的预览窗口右上角的电脑屏幕上 , 以检查是否被正确 tracked. 的特性

 Refresh-This 按钮将刷新整个用户只要 required. 特征检测过程

 Stop Tracking-This 按钮将停止跟踪特性和视频上的黑色矩形标记将会消失

框架还包括各种复选框显示的眼睛,鼻子,耳背式,ROI,眨眼,运动和眉毛。这使得用户选择功能他/她想要的应用程序显示在屏幕上。例如,如果选择表现出眼睛,鼻子眼睛和鼻子的视频将只显示矩形。

这个GUI显示检测按钮被按下后的主框架。用户选择显示的眼睛,鼻子,眉毛的准确标记复选框列表这些各自的特性。

这个GUI显示预览窗口使容貌按钮被按下时,如图15所示。

结果与讨论

答:应用案例研究-我

图16显示了人类的手势后左边和分段的手在右边。这个手势是用来选择的第一个模式即应用程序启动模式。在选择第一个模式,各种应用程序可以打开根据人类的手势。

经过选择的应用程序启动模式下,用户可以选择任何姿态并启动相应的应用程序。图17,姿态只有一个手指是用来打开记事本。两个手指是用来打开微软Word。像这样,有4个选项提供各种应用程序开始

图18显示了选择后第二模式即鼠标移动模式。在这种模式下,用户可以使用鼠标功能,如双击、右键点击光标移动。

b应用案例研究——:

GUI设计一直在测试不同的面孔和闪电条件和获得一个合理的精度检测。一旦面临被发现它是用来取代鼠标/键盘和鼠标控制是通过。如下图显示了不同人的系统测试和照明条件如图19所示的脸明亮的照明条件下,面对图20 B和胡须脸C与低照度条件在图21。

结论

我们已经研究了姿态检测系统,提出了一种技术来提高系统的适应性。讨论了两个应用程序场景,参照光标控制计算机系统替代选项,以传统的鼠标。一个应用程序是使用手势和另一个通过免提即面临的手势。这些系统上所使用的算法是行之有效的应用程序控制系统和获得一个合理的准确性。免提计算机接口在手势识别的一个重要方面有广泛的应用(如前所述)。识别的特性,是眼睛和鼻子尖端使用几种方法但模板匹配技术,利用SSR过滤器和SVM为我们提供了有效的使用简单的数学计算准确性和逻辑。约束保持光照条件恒定和统一的浅色背景,最低要求精度

承认

作者感谢UG学生帮助在这个研究工作。

数据乍一看


图1	图2	图3	图4	图5


图6	图7	图8	图9	图10


图11	图12	图13	图14	图15


图16	图17	图18	图19	图20


图21

引用

PankajBahekar, Nikhil Darekar Thakur ShamlaMantri,印度央行一个¢3 d手势识别人机InteractionA¢,CIITInternational《人工智能系统和机器学习,2012年1月

Hojoon公园。一个¢控制鼠标移动的方法使用一个实时CameraA¢,主人?论文2010。PragatiGarg,乃文Aggarwal SanjeevSofat,¢愿景建立手势RecognitionA¢,世界科学院、工程与科技,2009,pp.1-6。

罗伯逊P。,Laddaga R。,Van Kleek M, Ã¢ÂÂVirtual mouse vision based interfaceÃ¢ÂÂ, Proceedings of the 9th international conference on Intelligentuser interfaces Pp 177-183, 2004

¢一炷烽15 Lien便携式的HCI -建立一个实时的手鼠标系统手持DevicesA¢

加里•Bradski Adrian Kaehler学习OpenCV, O ?赖利媒体,2008年。

Nilesh J尤克里里琴,司令部先进、¢培养研究计算机视觉在毕业生和拓展使用开放附近¢,InternationalJournal应用信息系统(IJAIS),卷1 A¢没有。2011年2月4日,

Erik Hjelm和恩凯低,一个¢人脸检测:surveyA¢。计算机视觉和图像理解83、236 A¢274 (2001)。

OrayaSawettanusorn,上帝Yasutaka ShinjiroKawato、NobujiTetsutani Hironori山内,¢检测面子代表UsingNewly提出FilterA¢。

保罗中提琴,迈克尔·J。琼斯,一个¢健壮的实时脸DetectionA¢。国际计算机视觉杂志57(2),2004年,页137 A¢154。

彼得帝诺一个¢支持向量MachinesA¢。2003年计算机科学学院的伯明翰大学。

ShinjiroKawato和NobujiTetsutani¢尺度自适应实时人脸检测和跟踪与SSR过滤和支持向量是MachineA¢。

DhavalDholakiya Shashank古普塔和SunitaBarve。,Ã¢ÂÂReal-Time Feature based Face Detection and Tracking I-CursorÃ¢ÂÂ, In InternationalJournal of Computer Applications 48(24), Published by Foundation of Computer Science, New York, June 2012, pp 1-5.