有效的运动跟踪算法对立体视觉系统

Dheepak Mohanraj
助理教授,电气与电子工程部门,AMET大学印度钦奈。

文摘

摘要视频运动估计和补偿是一种编码技术的一部分,这有助于确定正确的运动矢量以及减少造成的错误将在视频图像在两帧间冗余。运动估计与补偿技术广泛适用于机器人的安全系统和运动跟踪系统。摘要开发一个高效的多个搜索算法可以克服现有算法的缺点基于中心钻石搜索算法搜索算法和三个步骤。该算法避免了无用的搜索从而提高计算时间、速度以及它有多个搜索特点,这有助于减少均方搜索和提供更好的搜索结果从而导致更好的运动矢量检测甚至更小的动作特别用于立体电视系统。

关键字

块匹配、立体电视系统、运动估计、最小块失真点(MBD)。

介绍

视频数据合并到电信服务的需求增加,公司环境、娱乐产业、机器人和甚至在家里使数字视频技术必不可少的一个。问题不过是静态图像和数字视频率非常大,消耗大量的带宽和存储空间等这个原因,视频压缩标准开发了消除图像冗余,使得视频信息传输和存储在一个紧凑和高效的方式更好的视频质量。一般来说,连续的图片在一个运动视频序列往往是高度相关的,也就是说,图片稍微改变一小段时间。

这意味着这些图片的算法区别很小。出于这个原因,压缩比为运动视频序列可能增加了编码算法两个或两个以上的连续帧之间的区别。相反,对象在运动增加帧的算法区别反过来意味着需要更多的比特编码序列。为了解决这个问题,利用运动估计来确定物体的位移运动。这是一个过程在一幅画是最好的相关元素在其他图片(一头或背后)运动估计量。的运动是封装在运动向量。前方运动矢量是指关联与先前的照片。向后运动矢量与未来参考相关的图片。一个有效的运动估计算法提高帧相关性,进而最小化像素运算的区别。

基于块的运动补偿

基于块的运动补偿视频压缩发生在许多不同的阶段。上面的流程图所示显示了早些时候的输出过程形式的输入后过程。因此选择在早期阶段后期的有效性产生影响。要完全理解这种类型的视频压缩所涉及到的一些问题需要检查每个阶段的细节。

这些阶段可以被描述为

帧分割

搜索阈值

块匹配

次优的块匹配算法

运动矢量修正

向量编码

预测误差编码

帧分割

当前帧的视频压缩分成大小相等的非重叠的矩形块。块大小影响压缩技术的性能。块大小越大,块的数量越少,因此更少的运动向量需要传播。然而,移动对象的边界通常不会配合块的边界,所以大需要更多的校正数据块传输小块导致更多的运动向量,但每个匹配块更可能匹配的目标,所以需要更少的校正数据。块大小太小然后压缩系统将对噪声非常敏感因此块大小表示最小化之间的权衡运动向量的个数和最大化匹配块的质量。

搜索阈值

如果目标块的区别和候选人过去帧块在同一位置低于某个阈值则认为没有运动发生,则返回零向量。从而避免搜索为代价的。大多数视频编解码器的雇佣一个阈值,以确定搜索的计算工作是十分必要的。

块匹配

块匹配是最耗费时间的编码过程的一部分。在块匹配的每个目标块的当前帧与过去相比框架为了找到一个匹配块。当当前帧重建的接收器匹配块作为当前帧的块的替代品。块匹配只有在帧的亮度分量。

块的颜色组件包括当编码框架,但他们通常不使用在评估潜在的替代品或候选块的适当性。可以进行搜索整个过去的框架,但通常局限于一个较小的搜索区域集中在当前帧中目标块的位置。

这一实践一个上限的地方,称为最大位移,在帧之间的对象可以移动多远,如果他们是有效的编码。最大位移被指定为最大数量的像素在水平和垂直方向候选人块可以从原始的目标块的位置。

匹配的质量通常可以提高了插值像素在搜索区域,有效地增加搜索区域内的决议,允许与部分位移假设候选人块。

次优的块匹配算法

详尽的搜索是计算非常密集,需要多次评估失真函数为每个目标块匹配。相当大的研究已经进入发展中块匹配算法,找到合适的匹配为目标块但需要更少的评估。这样的算法测试只有一些候选块的搜索区域,选择匹配块的从这个子集。因此,他们被称为最优算法。因为他们不检查候选块,所有的匹配块的选择可能不是一样好,选择一个详尽的搜索。

运动矢量修正

曾经最好的替代品,或匹配块,被发现为目标,计算运动矢量。运动矢量描述匹配块的位置从过去与参考帧的位置在当前帧目标块。运动矢量,无论他们是如何确定,可能不符合实际场景中运动。这可能是由于噪音、匹配算法的弱点,或局部最小值。房地产开发的空间依赖算法可以利用向量计算后试图改正。平滑技术可以应用于运动向量能够检测不稳定的向量和建议方案。

向量编码

一旦确定,运动矢量必须分配比特序列来表示。因为如此多的压缩数据将包括运动矢量,它们编码的效率有很大的影响压缩比事实上40%的部分通过编解码器可能会采取与运动矢量数据幸运的是,高运动向量之间的相关性及其不均匀分布使得它们适合进一步压缩。这必须无损压缩。有效的运动矢量编码本身是一个主题的研究和许多作家提供了技术最有效的建议。任何一个无损的通用压缩算法适用于编码向量

预测误差编码

尽管到目前为止所述的电池技术可以代码视频非常成功,他们很少产生完美的副本的原始帧。因此预测帧之间的区别和原始的未压缩的帧可能编码。通常这是应用基于块的块,只在部分明显不同于原始编码帧。变换编码是最经常用来实现这一目标,完全无损编码很少是一个目标。

视频编解码器

视频编解码器是一种装置,使数字视频的压缩或解压缩软件。压缩通常是有损的。从历史上看,视频作为一个模拟信号存储在磁带上。在光盘的时候进入市场作为一个数字格式替代模拟音频,也开始变得可行的存储和使用视频等数字形式和各种技术开始出现。高水平的视频编码器,适用于mpeg - 2, mpeg - 4、h标准。数字管道到达“原始”视频编码,应用一系列的转换和消除冗余信息的目的(无损)或无关的信息(有损)利用人类视觉系统(HVS)的特性。视频编码器的一个重要方面是去除时间冗余。这是通过运动估计(我)块编码器。

目标是代表每个视频帧的像素值的差异从一个参考框架。可以一个或多个参考系过去视频帧序列或框架。框架或框架部分,没有从引用提名为内部预测,从一个参考框架,框架部分,预测被称为国际米兰。编码是否内部或国米的选择是基于时间的可预测性框架或框架部分的参考。

典型的运动估计算法占很大一部分应用程序的CPU周期,在许多情况下(取决于算法的复杂性),这是已知的占总数的60%的CPU周期。

这个想法是为了实现降低比特率在不牺牲质量的视频信号。

因此,本文的分析目标运动估计算法在典型处理器微架构与芯片上的记忆,该算法使用相同类型的模式中使用钻石搜索算法减少步长。基于块失真最小的位置点(MBD)点,检查中使用点的数量变化的连续步骤。搜索模式显示在图5。

搜索步骤的数目减少到三个,小钻石搜索模式(SDSP)搜索达到第三步不管MBD的位置点。大钻石搜索模式(LDSP)反复使用,直到中心点成为MBD点。该算法总结如下。搜索步骤的数目减少到三个,SDSP搜索达到第三步不管MBD的位置点这样紧凑的配置和减少搜索点数比其他现有的算法提供了一个改进的性能。中间点成为MBD点。因此,紧凑的配置和减少搜索点数提供一种改进的性能比其他现有的算法如下。

算法

步骤1:初始LDSP集中在搜索窗口的起源。现在,测试每一个点在搜索模式。如果MBD点是中心点到步骤3。否则转到步骤2。

步骤2:形成一个新的LDSP MBD点为中心的观点。如果新的MBD点在中心位置,去将发髻。否则再一次重复这一步骤。

步骤3:形成了与先前的MBD SDSP点为中心的观点。在这个步骤中获得的新的MBD点即成为最终的解决方案。,the motion vector (x, y). The number of search points depends on the location of MBD point also determines the search direction.

立体视觉系统

使用两个摄像头,和对象的不同角度安装,校准技术用于对齐像素摄像机之间的信息和提取深度信息。这是最接近我们的大脑是如何工作的视觉测量距离。简化了立体视觉的图设置,相机都安装完全相互平行,并有相同的焦距。

图6中的变量有:

b是底线,或两个摄像头之间的距离

f是照相机的焦距

X_一个的轴相机

Z_一个是一个摄像机的光轴吗

P是一个真实的点定义的坐标X, Y, Z

u_l现实世界的投影点在图像被左相机

u_R现实世界的投影点在图像获得正确的相机吗

自两个摄像头相距距离“b”,两个摄像机视图相同的现实点P在不同的位置获取的二维图像。点的坐标的uL和你:

u_l= f * X / Z和u_RZ = f *(取向)/

预计这两个点之间的距离被称为“差距”,我们可以使用差异值计算深度信息,这是真实的点之间的距离“P”和立体视觉系统。

差距= u_l-你= f * b / z

深度= f * b /差距

立体视觉系统最适合应用程序的相机设置和位置是固定的,而且不会经历大的干扰。常见的应用包括导航、工业机器人、自动检查和监测。

立体视觉系统的应用程序

立体视觉系统最适合应用程序的相机设置和位置是固定的,而且不会经历大的干扰。常见的应用包括导航、工业机器人、自动检查和监测。

工业机器人

在机械工业自动化立体视觉系统是有用的任务如本挑选或板条箱处理。binpicking应用程序需要一个机器人的手臂从容器中选择一个特定的对象包含几种不同的部分。立体视觉系统可以提供一种并不昂贵的方式来获得三维信息,并确定哪些部分可以自由把握。它还可以提供单个产品的精确位置在一箱,使应用程序的机器人手臂从托盘和删除对象移动到另一个托盘或过程。

自动检查

3 d信息也是非常有用的,以确保高质量的自动检测应用程序。您可以使用立体视觉检测的缺陷,很难识别只有二维图像。罩板包装确保药片的存在,检查瓶子的形状和寻找弯针连接器都是自动检查深度信息的例子对确保高质量。

监测

立体视觉系统也有利于跟踪应用程序,因为它们是健壮的光照变化和阴影效果。立体视觉系统能够准确地跟踪对象提供3 d信息可以用来检测异常事件,如侵犯个人或废弃的行李。立体视觉系统也可以用来增强识别面部识别系统的准确性或其他生物识别技术。

结论

互联网越来越普及和多媒体技术和立体视觉系统已经发展,图像数据的沟通是生活中的一部分。为了在有限的传输带宽,采用效果传达最,高质量的用户信息。需要有更先进的压缩方法在图像和数据。在视频压缩计算部分和运动估计是最需要70%到90%的复杂运动估计与补偿技术,可以有效地消除相邻帧之间的时间冗余,已广泛应用于等流行的视频压缩编码标准mpeg - 2, mpeg - 4、h。全搜索运动估计算法不是冷杉为实时应用程序,因为它不可接受的计算成本。双向视频序列的主要噪声形式,我在视频序列预测缺失的数据,所以我们的想法是一个快速运动估计算法提高操作。

摘要加快搜索、基于三个步骤钻石搜索算法提出了不同的进化计算技术。提出的双向算法减少预测误差和搜索分每一帧的数量更少。该算法仿真结果表明误差最小,减少数量的搜索点相比,现有的算法。这些搜索算法搜索速度限制和模式很快时刻这样找不到精确的运动矢量。所以我们可以尝试不同的搜索模式和未来其他进化计算技术还可以试着更好的结果。三块大小的重要因素,搜索区域,可以匹配标准不同,如可变块大小,大的搜索区域复杂的运动和小区域低复杂动作和双向运动估计我们也将努力实现新技术将进一步降低MPEG视频编码的复杂性。这个算法运动跟踪系统可以更好的视频质量,使预测精度运动,这可以有效地用于立体电视系统。

数据乍一看


图1	图2	图3


图4	图5	图6

引用

B。liu and A.Zaccarin, New fast algorithms for the estimation of block motion vectors, IEEE Trans. Circuits Syst. Video technology, Vol.3,pp.440–445,Dec 1995.

I.E.G.理查森。h和mpeg - 4视频压缩。威利,奇切斯特,英国,2003年。

Parhami。计算机算法:算法和硬件设计。牛津大学出版社,2000年。

ISO / IEC15444。信息技术——如JPEG2000图像编码系统。2000年。

伊恩•e . g .理查森版权问2002年约翰·威利& Sons有限公司isbn: 0-471-48553-5(精装);0-470-84783-2(电子)

Y。王,J。Ostermann Y.Q.Zhang。视频处理和通讯。清华大学出版社和Prentice Hall,北京,中国,2002。

ISO / IEC 11 172 - 2,信息technology-coding移动的图片和相关的音频数字存储媒体高达1.5 Mbit / spart2:视频”,1993年MPEGl视频。

GorpuniPawankumar和GanapatiPanda发展运动估计与补偿算法对视频压缩的数字存储媒体,印度2009年。

Tekalp Murat a .数字视频处理,Prentice Hall, PTR, 1995年。

国际期刊的创新在计算机和通信工程的研究

有效的运动跟踪算法对立体视觉系统

文摘

关键字

介绍

相关工作

基于块的运动补偿

次优的块匹配算法

运动矢量修正

向量编码

预测误差编码

视频编解码器

算法

立体视觉系统

立体视觉系统的应用程序

导航

工业机器人

自动检查

监测

结论

数据乍一看

引用