所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

Fixation-Based视觉图像分割使用Border-ownership的概念

Manjusha辛格1,阿布Misal2
助理教授,CSE的部门,希瓦理工的杜尔格,Chattisgarh、印度1
助理教授,部门等,希瓦理工的杜尔格,Chattisgarh、印度2
相关文章Pubmed,谷歌学者

访问更多的相关文章国际创新研究期刊》的研究在科学、工程和技术

文摘

背后的原因的选择分割图像基于定点源于人类感知对象周围环境的方式。即使我们的眼睛一直注视在现场看到/感知不同的东西,大多数计算机视觉算法还没有给任何固定的意义。相信固定(视觉注意力的一部分)是人类视觉系统工作的原因。该方法提出了一种方法,我们不段的几个地区的整体形象,然后在这些区域可能是什么原因,但段只包含我们的注视点的区域。简言之分段对象从现场意味着找到一个€•固定pointa€–和发现物体的轮廓,包含我们的兴趣点。Border-ownership自动固定策略寻找兴趣点和它意味着知道对象的边界。使用边界所有权信息,我们自动选择固定点在图像中所有可能的对象和领域。本文还简要地讨论了一些其他方法可以用来选择固定分如Contrast-Saliency模型和Symmetry-saliency模型但我们使用Border-ownership方法。

关键字

视觉、border-ownership固定、对比度、对称。

介绍

随着信息技术的发展,图像信息的主要来源。如何分析和处理这些图像有效一直是研究的重点。在图像分析和处理中,人们往往只对一些感兴趣区域称为对象或前景。因此,它需要将这些对象的图像做进一步的图像处理。图像分割技术,可用于将图像划分为若干区域和对象从背景中分离。
在研究期间,人们发现人类有非凡的能力在复杂场景快速找到感兴趣的对象叫做?视觉注意呢?。是非常重要和必要的介绍图像处理中的视觉注意力机制,因为它可以减少计算复杂度,节省计算资源,提高图像处理的效率[1]。
图像分割的目的是将一幅图像划分成有意义的区域和对象(相关内容)对一个特定的应用程序。我们的感官视觉是最先进的,所以图像扮演最重要的角色在人类观察。人类视觉系统(HVS)是已知一个关注模块使用低级视觉线索(如颜色、纹理等)在现场快速找到突出的位置。人类的眼睛是那么吸引这些凸点(也称为固定)。这些注视点会用作识别标记为场景中感兴趣的对象。人类的灵长类动物的视觉系统观察和有意义的动态场景(视频)或静态场景(图片)通过一系列的固定在不同的场景中突出的位置。
提出了一种新的分割方法[2]中生物动力,连接分割和视觉注意力(灵感来自于人类的视觉系统)。尽管固定是已知的人类视觉系统的一个重要组成部分,它由计算机视觉研究人员在很大程度上被忽视了
人类视觉系统有两种类型的注意:公开的关注(眼球运动)[3]和隐蔽的关注(没有眼球运动)在这工作,公开的关注意味着只要注意使用这个词,所以注意分为两类基于其部署在一个视觉场景是否遵循现场特点或意图:第一个被称为自底向上,是由低级的流程;第二是指自上而下的过程。大部分工作已经发生在自底向上的注意。功能集成理论[4]表明,当感知刺激,特点是“自动提前注册,,和并行,而对象分别确定”和后期的处理。功能集成理论是一个理论的关注,激发了许多自底向上的视觉注意模型[5,6]。最欣赏的是[7]中提出的,它已成为一个标准的自底向上的视觉注意模型,在凸起由于原始特性,如强度、方向和颜色独立计算。这样的模型是不合适的,因为它常常失败的时候注意力要集中在一个对象。注意使眼睛移动和注视在一个新的位置。每个固定将躺在一个对象,确定该对象(可以在后台区域)的分割步骤。现在,分段固定区域被定义为找到?最优? enclosing contour—a connected set of boundary edge fragments—around the fixation. This new formulation of segmenting fixated regions is a well-defined problem. This algorithm takes a fixation point as its input and outputs the region containing the given fixation point in the scene. Advantage-The segmentation becomes a fully automatic process which finds the optimal segmentation of the fixated regions without any user input.

二世。动机

多年来,提出了许多不同的算法,图像分割成区域,但什么是正确的定义或?需要吗?图像的分割(或场景)很大程度上是模糊不清的计算机视觉的社区。大多数分割算法依赖于某种形式的用户输入,而图像的最优分割的定义是模糊的。
对一个特定对象的兴趣,正确的/理想的分割场景中感兴趣的对象是由一个或几个地区。分割的目标一个场景是复杂与场景中感兴趣的对象,可以定义良好的只有感兴趣的对象识别和已知的预先分割算法。但必须知道感兴趣的对象之前分段现场似乎使问题之一,许多矛盾的问题在计算机视觉中,我们通常需要首先段场景,来识别对象。所以,我们如何能确定一个对象之前分段吗?所以现有的分割算法不能正确/预期的结果。

三世。FIXATION-BASED分割方法

在这里,自下而上的图像分割。我们忽略(自顶向下)对象识别的贡献在分割过程中,我们预计部分图片没有识别对象。对于给定的注视点,分段点的地区/对象包含一个twostep过程[2]:
提示处理:视觉线索,如颜色、纹理、运动和立体声生成概率边界边缘地图中一个像素的概率在场景中的任何对象的边界是存储为其强度。
细分:对于给定的注视点,最佳的封闭轮廓(连接组边界边缘像素)在这一点上概率地图边缘。这个过程是在极地空间进行分割过程规模不变。
为了段多个对象,注视点的分割过程将重复在每个感兴趣的对象。然而,边缘地图包含两种类型的边缘,即边界(或深度)和内部(或纹理/强度)边缘,所以重要的是能够区分无边界的边界边(如纹理和内部)的边缘。
极地空间方法?通过概率边界封闭的轮廓边缘痕迹在笛卡儿坐标系统空间映射到极坐标系统并给出了最优封闭轮廓在固定表明我们获得分割精度。
对于这个分割框架,固定只需要在场景中的对象。只要是正确的,正确的分割将获得。这种细分方法显然取决于注视点,因此重要的是要选择自动固定。可以有不同的方法来自动选择固定;我们使用Border-ownership。

四、BORDER-OWNERSHIP

边境的所有权边界像素包含对象的边信息[8],这意味着知道对象的边界。除了帮助选择点在对象内部,边境也有助于区分所有权信息封闭轮廓对应对象(对象)的边界和封闭物体轮廓(一个封闭的轮廓不对应于图像中任何对象的边界)。这个系统的概述如下:概率边界边缘地图生成使用颜色、纹理和运动线索。像素的显著的可能性边界,边界的所有权也估计。使用所有权边界信息,分在不同的对象将自动被选中。周围的每一个点,[2]发现概率的封闭轮廓边界边缘地图。产生的封闭轮廓的一个子集,惟一地对应于对象最终选择作为系统的输出。清理任何虚假的封闭轮廓仍然留在输出,最后时间持久性也执行。
这个方法只选择那些封闭的轮廓对应场景中的对象而拒绝复制和非封闭的轮廓。

诉的方法选择固定的点:

有不同的方法和算法,选择固定点然后分割过程可以进行选择的点:
答:Contrast-Saliency模型:
center-surround对比这个特点方法计算独立特点的基本特性,利用亮度,颜色,和取向形成鲜明对比。这个模型是今后称为contrast-saliency模型。这是一个视觉注意力系统,灵感来自于行为和神经元早期灵长类动物视觉系统的体系结构。卓越模型常常选择固定接近物体的边界。在这方面,多尺度图像功能结合成一个单一的地形特点的地图。动态神经网络选择参加位置显著的递增顺序链接在一起的。系统分解复杂的问题场景理解的快速选择,计算高效的方式,显眼的位置,详细分析了[7]。
b . Symmetry-saliency模型:
解释一个场景时,人类关注对象,与其说基本特性。因此,构形的功能起着重要的作用在人类视觉的注意。构形的特性是一个高级特性,它集成了不同部分的图。对称性,例如,可以是一个强大的视觉吸引子比基本特征[9]。人眼注视也可以预测基于对称的形象。对比焦点附近的角落和边缘图像,而对称强调对称配置通常配合场景中的对象。在[10],对称对比显著优于显示模型检测凸场景中的对象。提出了一种分割方法自动检测和分割(ADAS)基于这个模型。
为检测对象,使用对称因为分割的质量改善当固定分对象的中心附近的谎言。
局部对称性在给定像素的数量,计算p = (x, y),通过应用一个对称的内核像素[10]。像素双对称内核为当地对称值。一对由两个像素,π和pj, p = (pi + pj) / 2。像素的贡献对当地p对称计算通过比较强度梯度giπ和梯度gj pj:
图像
γi =θi -α是梯度的方向之间的夹角,θi,和角α,π和pj之间的界线。第一项情商。(1)有一个最大值,当γi +γj =π,它适用于梯度方向镜像对称的p。只使用这一项也应对两个像素有相同的梯度方向,因此躺在一个直尺。因为我们想要找到的中心对称模式,第二项的方程降低像素对具有类似梯度方向。
所有实验表明改进的对称特点模型在contrast-saliency模型的性能。
c . Border-Ownership方法:
边境的所有权被报道注册在灵长类动物的视觉皮层的神经元。结果表明,深度信息中最重要的是确定边界像素边界的一个对象的所有权。他们还报告,确定边界的所有权发生由于视觉线索的本地处理。在计算机视觉文学边界的一个流行词所有权是图/地面作业。但相比静态的单眼线索,深度和运动信息更强的线索在确定边界的所有权边界边缘像素[8]。

VI。方法进行细分:

答:概率边界边缘地图:
边缘检测是计算机视觉领域的一个非常重要的领域。边缘定义之间的边界地区一个图像,这有助于分割和对象识别[11]。概率边界边的地图,一个像素的强度的概率将深度或接触边界的场景。雷竞技网页版概率在深度不连续的边界可以通过检查确定光学流映射对应的像素位置,因为深度不连续介绍光学流中的不连续映射。但是光学流中不连续的确切位置地图往往与真实对象边界不匹配,一个众所周知的问题光流算法。考虑到这一点,我们用一些静态信息,比如颜色和质地,第一,找到所有可能的边界位置的图像边缘像素与积极的颜色和/或纹理梯度。然后,这些边缘像素的概率在深度和接触边界确定。雷竞技网页版最大的两个概率分配作为边缘像素的概率在物体边界,PB (x, y)。请注意,颜色和纹理梯度值不参与确定边界概率[8]。
b .固定策略:
固定的策略是选择的目标点内对象,以便fixation-based分割方法[2]将这些点并生成封闭的边界封闭这些点。选择的点,我们首先选择概率边界的边缘像素边缘地图边界概率大于0.5,并假设他们躺在一些对象在图像的边界。我们代表这个子集边界边缘像素的IB如下考虑:
图像
此外,我们估计边界的所有权(对象)的边缘像素IB。边界边缘像素IB可以深度或接触边界。雷竞技网页版一个像素的深度不连续,对象是接近相机这意味着将有更大的光流值。
为一个像素在接触边界,对象的颜雷竞技网页版色分布不同于已知的颜色分布的表面。我们计算的属性之间的差异双方的边缘像素[8]。
基于c .固定分割:
为每一个选定的点在前一节中,发现基于固定的分割方法[2]发现封闭的边界在给定的点通过结合边缘像素的概率边界边。每个点的分割有两个中间步骤:首先,概率边界边缘地图PB转换从笛卡尔到极地空间使用给定的点作为磁极转换,以达到规模不变性。这后,极地的二元分割边缘地图生成最优路径通过极地边缘地图,当曲线映射回原笛卡尔空间,它包含点。所有固定分两步重复分割过程中发现前一节中使用相同的PB [8]。
d .选择封闭轮廓对应对象:
我们已经尽可能多的封闭轮廓点选择的固定数量的策略。因为点的选择取决于IB的轮廓片段,片段的部分相同的对象边界生成多个点躺在同一个对象;这些点产生重复的封闭轮廓。同样,有时由于错误估计的边境的所有权优势片段,对应点在于以外的任何对象的形象将会导致一个封闭的轮廓不对应一个对象。所以,我们需要一个过程,筛选所有的封闭轮廓只挑选那些惟一地对应于场景中的对象。我们需要一个方法来区分任意两个封闭的轮廓[8]。
e .颞持久性:
区域选择这个解决方案可能仍然包含虚假地区出现由于错误检测到强边缘概率边界边的地图。假的一个简单的方法来摆脱地区不必使用高水平知识是基于这样的观察:吵闹的边缘概率边界边的地图是由噪声引起的流图中我们使用运动线索来确定实验对象边界。自噪声的影响不是局部,而是改变流中的位置地图随着时间的推移,错误检测边界边缘碎片也会改变。这意味着,这些边缘碎片形成的虚假的地区也会改变。所有这一切表明,如果我们对框架2和3重复整个过程和匹配所选地区的地区获得帧1和2(我们正在考虑连续三帧的一个场景),和只接受所发生的区域在这两种情况下,我们最终丢弃的大部分虚假的地区。坚持时间的地区更有可能实际对象[8]。
整个方法流程图,如图1所示:

七世。预期结果

性能是衡量有多少对象对应一个分割轮廓(回忆),有多少分割轮廓对应于实际对象(精度)。
颞持久性帮助清除封闭轮廓引起的噪声边缘像素的概率边界边缘地图。它提高了系统的精度25%。进一步改善精度可以通过使用一个识别系统,将匹配轮廓的知识库拒绝任何未知的轮廓。
预计该系统,平均20段17个对象保存在一个表给定一个场景的连续三帧。
评估的效率固定策略,所有选择固定点的百分比计算,实际上躺在一个对象,它预计为85%。最后的评价是预测的鲁棒性边界的所有权(或对象),计算像素的比例的均值与正确的对象一边预测任何对象边界。它预计为93%。

八世。结论

描述一个系统自动部分对象的大小或形状。系统是基于分割应该产生一个封闭的轮廓周围的注视点的关注。两小说的贡献这工作是一个固定的策略(基本的注意机制)来选择对象上的点,和一个策略只选择相对应的区域对象。系统的输入是一个最低的三个场景的图像。此外,分割步骤可以并行进行所有选中的点,因为他们不互相依赖。使用border-ownership似乎更有前途的然后symmetry-saliency或contrast-saliency模型选择固定的点

数据乍一看

图1
图1

引用

  1. Qiaorong张Guochang顾,肖家,图像分割基于视觉注意力机制,?多媒体杂志,芬兰,签证官。4(6),第370 - 363页,2009年12月。
  2. Ajay k . Mishra Yiannis Aloimonos,昌龙华氏温标和阿什拉夫卡欣?主动视觉分割?IEEE交易模式分析与机器智能(TPAMI), 34卷,2012年4月4号。
  3. g . Kootstra和l . r . b . Schomaker。使用对称预测人眼注视。在认知科学会议(认知科学),阿姆斯特丹,荷兰,2009年。
  4. 点-特雷斯曼和g . Gelade。feature-integration理论的关注。认知心理学12没有97 - 136页,1980年。
  5. 林祖嘉威廉姆斯a .霍林沃和J.M.亨德森。看到并记住:视觉上特定的信息保留在内存中从以前参加的对象的自然场景。心理计量学公告与评论,8:761 - 768,2001。
  6. j·m·亨德森。人类的目光在真实世界的场景知觉控制。认知科学趋势,7:498 - 504,2003。
  7. l . Itti c·科赫,大肠Niebur。基于卓越的视觉注意力模型的快速场景分析。IEEE模式分析与机器智能,20(11):1254 - 1259年,1998年。
  8. Mishra, a和Aloimonos, y ?“简单”的视觉分割对象机器人吗?诉讼:机器人科学和系统会议(RSS),洛杉矶,2011年6月27日- 7月1日。
  9. Kootstra G。,Bergström, N., and Kragic, D. (2010) ?Fast and Automatic Detection and Segmentation of Unknown Objects? In: Proceedings of the IEEE-RAS International Conference on Humanoids Robotics (Humanoids 2010), December 6-8, 2010, Nashville, TN.
  10. g . Kootstra n . Bergstrom和d . Kragic ?使用对称选择固定为分割点,?2010年国际Converence模式识别。
  11. e . Nadernejad Sharifzadeh和h·娜?边缘检测技术:评估和比较?应用数学科学,2卷,2008年。31日,1507 - 1520
  12. d·马丁,c . Fowlkes和j·马利克。?学习检测自然图像边界使用本地亮度,颜色和质地的线索吗?T-PAMI, 26(5): 530 - 549年,2004年5月。