关键字 |
图像分割,图分割,最大似然,最大后验,马尔可夫随机场。 |
介绍 |
1.1图像分割 |
在计算机视觉中,分割是指将数字图像分割成多个段(像素集,也称为超级像素)的过程。分割的目标是简化和/或改变图像的表示,使其更有意义,更容易分析。图像分割通常用于定位图像中的对象和边界(直线、曲线等)。更准确地说,图像分割是为图像中的每个像素分配标签的过程,以便具有相同标签的像素共享某些视觉特征。图像分割的结果是一组共同覆盖整个图像的段,或者是从图像中提取的一组轮廓(参见边缘检测)。区域中的每个像素在某些特征或计算属性(如颜色、强度或纹理)方面是相似的。相邻区域相对于相同的特征有显著的差异。图像分割的实际应用有医学成像、模式识别、指纹识别、人脸识别等。自计算机视觉研究早期以来,图像分割和视觉分组问题就受到了广泛的关注。众所周知,视觉分组在人类视觉知觉中起着重要的作用。 Many computer vision problems, such as stereo vision, motion estimation, image retrieval, and object recognition, can be solved better with reliable results of image segmentation. For example results of stereo vision based on image segmentation are more stable than pixel-based results . Although the problem of image segmentation has been studied for more than three decades, great challenges still remain in this research. |
1.2图像分割分类 |
现有的图像分割算法可以分为两类:基于轮廓的方法和基于区域的方法。基于轮廓的方法试图找到图像中物体的边界,而基于区域的方法试图将图像分割为连接的区域。 |
基于轮廓的方法的主要思想是以样条曲线的形式表示一些初始边界形状,并通过收缩和展开操作迭代修改它以最小化一些能量函数。这些方法是基于物理的模型,在牛顿力学定律下变形,特别是通过拉格朗日动力学中表达的弹性理论。许多基于轮廓的分割算法在过去的二十年中得到了发展。 |
基于区域的方法尝试将图像分类为多个一致的区域或类。 |
1.3现有系统存在的不足 |
这些算法存在的一个问题是它们很容易陷入局部极小值。此外,它们需要手动指定靠近感兴趣对象的初始曲线。基于区域的方法尝试将图像分类为多个一致的区域或类。阈值分割是最简单的分割方法,但其性能通常不能令人满意。流域分割是传统的基于区域的分割方法之一。分水岭变换常用于分割触摸对象。如果图像被视为具有山脉(高强度区域)和山谷(低强度区域)的表面,它会在图像中发现强度谷。形态学运算通常用于处理分水岭变换得到的输出中的过分割问题。分水岭通常用于图像的前景和背景(两类)分割。对于具有许多不同区域的一般彩色图像,它通常会给出不好的结果。 It is also sensitive to the morphological structuring element. |
1.3.1提出的图像分割算法 |
本文提出了一种新的基于概率最大化模型的图像分割算法。交替进行MAP估计和最大似然估计的迭代优化方案是分割的关键。我们用mrf对MAP估计建模,并使用图切割解决MAP- mrf估计问题。ML估计的结果取决于我们使用的统计模型。在高斯模型下,通过求区域特征的均值得到。 |
结果表明,其他统计模型也适用于我们的框架。本工作的主要贡献包括: |
1)提出了一种新的图像分割概率模型和迭代优化方案 |
2)利用图切割解决多区域分割问题,根据区域的性质自动调整区域数量。 |
该算法能够很好地聚类图像中的相关区域,分割边界与区域边缘匹配。大量的实验表明,我们的算法可以获得与人类感知高度一致的结果。定性和定量比较表明,我们的算法优于其他六种最先进的图像分割。 |
一种图像分割的迭代优化方案 |
|
2.2色彩空间转换 |
一般来说,每个数字图像都应该是RGB色彩空间的形式,分别代表红、绿、蓝三种颜色。在我们的算法中,为了标记彩色图像的像素,将RGB彩色图像转换为L*a*b颜色空间,其中L代表像素的亮度,a和b分别代表图像的水平和垂直维度。进行这种转换是为了使分割过程更容易,并提供有效的分割。 |
2.3 k-means聚类算法 |
为了在我们的算法中进行迭代过程,首先我们必须对图像中的区域进行聚类。为了进行聚类,我们使用K-means算法。现在我们分析了算法的计算复杂度。在第2步中,K-means算法花费O(NdKTk)时间,其中N是图像中的像素数量,d是用于表示像素/区域的特征数量,K是聚类数量,Tk是迭代次数。在我们的应用程序中,d = 4, K设置为10,Tk设置为100。 |
一个新的概率模型 |
标签的配置 |
在本节中,我们首先介绍了用于描述每个像素属性的特征,然后提出了新的概率模型。对于给定的图像P,每个像素P的特征都由一个四维向量表示 |
I(p) = (IL(p), Ia(p), Ib(p),It(p))T (1) |
其中IL(p), Ia(p), Ib(p)是p在L*a*b*颜色空间中的分量,It(p)表示p的纹理特征。图像分割的任务是将图像的像素分组到相关的区域。如果我们计算 |
它是一个标记问题,目标是找到一个标签配置f={fp/p},其中fp是像素p的标签,表示该像素被分组到哪个区域。一般来说,一个“好的”分割意味着一个区域i中的像素应该共享由向量Φ(i)表示的同质特征,该特征除了在区域边界上不会快速变化。 |
仿真结果 |
|
结论 |
在这个阶段的项目工作中,我使用K-means算法对图像中的区域进行聚类,然后实现MAP估计,对具有初始区域特征的区域中的像素进行标记。为了对完整的图像分割进行迭代过程,我需要实现ML估计,以找到每个像素当前标签值的区域特征。然后实现图割算法,减少图像的数据项和平滑项。我将在我的项目的下一个阶段完成这两个模块,通过执行迭代,我将以高分辨率分割图像。 |
参考文献 |
- D. Scharstein和R. Szeliski, â '  ' Middlebury立体视觉page.â '  '[在线]。可用:http://www.middlebury.edu/stereo/
- M. Kass, A. Witkin, D. Terzopoulos, â '  '蛇:主动轮廓模型,â '  ' Intâ '  ' l J.计算机视觉,第1卷,第1期。4, pp. 321Ãⅰ '  ' 331, 1988。
- L. Cohen等,â '  '关于主动轮廓模型和气球,â '  ' CVGIP:形象《理解》第53卷,no。2, pp. 211Ãⅰ '  ' 218, 1991。
- C. Xu和J. Prince, â ' “蛇,形状和梯度向量流,â ' ”IEEE Trans。《图像处理》第7卷第1期3, pp. 359Ãⅰ '  ' 369, 1998。
- E. Mortensen和W. Barrett, â '  '“基于智能剪刀的交互式分割,â ' ”图形模型与图像处理,vol. 60, no. 1。5, pp. 349Ãⅰ '  ' 384, 1998
- T. McInerney和D. Terzopoulos, â ' “医学图像分析中的可变形模型:综述”,â ' ”医学图像分析,第1卷,第1期。2, pp. 91Ãⅰ '  ' 108, 1996。
- D. Cremers, M. Rousson, R. Deriche, â '  '“一种基于统计方法的水平集分割:整合颜色、纹理、运动和形状,â ' ”国际计算机视觉杂志,第72卷,no. 1。2,页。195 A¢215,2007。
- 范晓明,范晓明,范晓明,â '  ' '基于同态水平集的多室分割框架,â '  ' .计算机视觉与模式识别,2008。
|