所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

一种有效的手势识别系统跟踪器操作算法

奇。年代1和m Z Kurian博士2
  1. 研究生M.Tech [VLSI & ES], SSIT,图姆库尔,卡纳塔克邦,印度
  2. Dean & HOD, SSIT, Tumkur,卡纳塔克邦,印度
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际电气、电子和仪器工程高级研究杂志

摘要

提出了一种基于视觉的基于裸手跟踪的动态用户界面手势识别系统。本文详细介绍了基于视觉的直方图跟踪器的有效初始化算法的实现细节,该算法结合了检测输入图像中手部姿态的凸轮轴算法,以及通过标定、皮肤检测和ROI跟踪两种独特姿态跟踪器点初始化和退出跟踪的有效算法。本文旨在检验Cam Shift算法的有效性,跟踪点初始化和出口输入命令跟踪,作为一种通用的手脸跟踪方法。在这种情况下,没有对要跟踪的手掌做任何假设。

关键字

跟踪,ROI, HCI, Camshift,功能。

介绍

人类手势交流的词汇有很多变化。手势是一种被广泛使用的非语言交流方式。视觉监控是运动目标跟踪、视频压缩和自动应用等方面的关键技术。大多数应用要求目标跟踪算法在块、照度变化和目标缩放、旋转的情况下,具有鲁棒性[1-2]。同时,跟踪算法也需要消耗尽可能少的时间来满足实时性的要求。因此,高效的跟踪算法camshift是将跟踪器纳入手势识别系统的有效解决方案之一[3-4]。
A. camshift算法
连续自适应均值漂移算法(CamShift)是均值漂移算法的手部跟踪的适应,旨在为感知用户界面的手掌和面部跟踪迈出一步。该方法采用了CamShift算法,并扩展了一个默认实现,允许对特征空间类型和任意数量进行跟踪。为了计算像素值属于目标模型的新概率,需要在直方图反投影之前用简单的单调递减核轮廓对多维直方图进行加权
B. camshift算法
CamShift算法可以归纳为以下步骤:
1.将概率分布图像的感兴趣区域(ROI)设置为图像。
2.选择Mean Shift搜索窗口的初始位置。要跟踪的目标分布将是选定的位置。
3.计算以Mean Shift搜索窗口为中心区域的颜色概率分布。
4.迭代Mean Shift算法寻找概率图像的质心。存储第零力矩(分布区域)和质心位置。它被用来求解非线性方程组。它可以很容易地找到临界点附近的解。为此,采用了局部参数化延拓技术[4,5]。
5.对于下面的帧,将搜索窗口置于步骤4中找到的平均位置的中心,并将窗口大小设置为第0个矩的函数。转到步骤
C.连续自适应分布
概率分布图像(PDF)可以使用将像素值与给定像素属于目标的概率相关联的任何方法来确定。直方图反投影是一种常用的方法。在生成PDF的过程中,Camshift算法的第1步从滤波后图像的初始ROI计算初始直方图。
在Bradski(1998)中使用的直方图由HSV颜色空间中的色相通道组成,然而来自任何颜色空间的多维直方图都可以使用。将直方图量化到箱子中,这降低了计算和空间复杂性,并允许相似的颜色值聚在一起。然后使用方程在最小和最大概率图像强度之间缩放直方图箱。
方程
其中x(i)和y(i)为分割区域中的第ithpixel, k为分割区域中的像素数。为了跟踪手势,我们取N帧,计算质心值,即x和y坐标,然后我们可以找到如图1所示的输出,将生成不同的手势模式,然后调整大小并转换为二值图像。

框图

手势识别对于开发一种有吸引力的替代流行的人机交互(HCI)模式非常重要。手势识别对于开发一种有吸引力的替代流行的人机交互模式非常重要。手势识别对于开发一种有吸引力的替代流行的人机交互模式是很重要的。图2所示的系统设计描述了用于设计通过从用户获取手势的图像或视频来初始化的动态用户界面的技术。
所考虑的不同手势是不同手势的序列。一个特定的手势可以经历运动和离散的变化。这些手势是根据运动的性质来区分的。实时识别引擎正在开发,可以可靠地识别这些手势,尽管个别变化。该引擎还能够自动检测手势序列的开始和结束。

算法

a .基于视觉直方图的跟踪器跟踪ROI
该过程所涉及的步骤如图3所示,具体步骤如下。
1.系统对象是通过在创建被跟踪对象的BBOX中读取视频帧来创建的
2.首先考虑包含被跟踪对象的第一帧,将图像转换为HSV颜色空间。
3.对象是基于第一视频帧的色相色彩空间设置的。
4.显示的结果是通过绘制框周围的对象被跟踪的色调通道与背景区分。
5.因此,显示结果后,视频可以加载。
视觉直方图跟踪器产生一个直方图系统对象,计算每个输入矩阵中元素的频率分布。运行直方图定义在步进方法中调用的连续计算,此属性设置为true以启用计算运行直方图。对象将通过像素值的集中直方图来跟踪,因此称为基于直方图的跟踪,其中包含CAMSHIFT。被跟踪对象的边界框[BBOX]采用步进方法,以' I '为输入图像,' H '为基于被跟踪对象的直方图,使用'初始化对象'通过设置初始搜索窗口来识别被跟踪对象,边界框为[x y width height]指定的成分。BBOX的方向决定了与物体具有相同二阶矩的椭圆的长轴与x轴之间的夹角,物体的范围为-π/2到π/2。置信度SCORE表示返回的BBOX是否有跟踪对象,取值范围在0到1之间,最大置信度为1。
B.跟踪器操作的初始化(启动)和退出(停止)
开始手势表示用户可以开始向系统输入,直到用户使用停止手势,直到输入被系统接受和检测。同时,其他操作手势被注意到它们不应该是为启动和停止操作定义的相同类型。
1.启动和停止操作从获取输入图像和跟踪ROI开始。
2.跟踪输入帧被限制为500帧,跟踪器将在500帧后超时,以初始化新的输入。
3.标定操作进行20次迭代,向系统提供颜色样本。
4.下一步是通过计算感兴趣区域的质心来创建围绕感兴趣区域的包围框来跟踪目标。输入样本到系统的阈值定义为3,如果超过阈值则创建包围框。
5.为了使输入信号的跟踪“ON”,将输入校准样本的值限制在比1<1.6 &&比1>0.7范围内的系统(如图4所示)。
6.然后使用x和y坐标计算BBOX的中心值。一旦中心值被识别,就会初始化跟踪器,否则就是一个STOP手势。

结果解释

图5显示了mat实验室窗口中特定子图中手势信号的皮肤颜色校准,并详细说明了mat实验室窗口中特定子图中手势信号的皮肤颜色校准,图6表示为校准对象选择的区域,即不同区域的手颜色。其中,选取并存储用于动态手检测的区域值由凸轮轴算法完成。图7显示了初始化的跟踪器点,从实际检测输入开始。图8显示了从开始手势中保持手部运动到系统的开始输入命令,图9显示了停止手势,这是用于停止系统检测识别操作并开始新的输入的唯一手势。

结论

本文以一种舒适的方式提出了一种有效的跟踪点初始化和跟踪ROI退出的算法,并采用了两种独特的启动和停止跟踪操作手势。连续自适应均值漂移算法(Camshift)是手势识别与检测中的一个重要问题。Camshift是一种优秀的实时跟踪算法。然而,实时跟踪对于某些场合,如实时性要求较高,视频捕捉设备的IO占用时间较大,如何进一步提高Camshift算法的计算速度仍然是一个严重的问题。本文的计算跟踪过程和建模数据量对算法性能的影响Camshift算法可以在一定程度上减少计算时间的同时,克服背景噪声。

数字一览



数字 数字 数字 数字 数字
图1 图2 图3 图4 图5
数字 数字 数字 数字
图6 图7 图8 图9

参考文献












全球科技峰会