您好,欢迎来到爱站旅游。
搜索
您的当前位置:首页基于主动轮廓模型的图像分割算法

基于主动轮廓模型的图像分割算法

来源:爱站旅游
2007年第4期 漳州师范学院学报(自然科学版) No. 4. 2007年 (总第58期) Journal of Zhangzhou Normal University(Nat. Sci.) General No. 58

文章编号:1008-7826(2007)04-0041-06

基于主动轮廓模型的图像分割算法

高 梅1 , 余 轮2

(1. 福建行政学院, 福建 福州 350002; 2. 福州大学 物理与信息工程学院, 福建 福州 350002) 摘 要: 主动轮廓模型算法是目前流行的图像分割算法, 其主要优点是无论图像的质量如何, 总可以抽取得到光滑、封闭的边界. 本文综述了主动轮廓模型算法的发展概况, 并分类介绍了各算法的特点. 此外, 本文还给出了算法发展的方向, 以及今后研究所面临的关键问题.

关键词: 图像分割 ; 主动轮廓模型 ; 水平集方法 ; 纹理分割

中图分类号: TP391.41 文献标识码: A

1 引言

图像分割的任务是把图像分成互不交叠的有意义的区域,每个区域内部的像素都具相似性,而在边界处具有非连续性. 它是图像分析和理解的首要一步,分割结果的好坏直接影响对图像的理解. 由于尚无通用的分割模型,现有的分割算法都是针对具体问题的,因此,图像分割的研究多年来仍然受到人们的高度重视[1].

基于变分的方法是近年来研究颇为活跃的一个分支,它将图像分割问题表达为能量函数的最小化,并由变分原理将其转化为偏微分方程的求解[2]. 相比于传统的区域分割方法,变分方法可以通过定义能量函数,综合考虑几何约束、与图像内容有关的约束条件,获得更加自然的分割效果. 主动轮廓模型是目前流行的基于变分的图像分割算法[3]. 其主要优点是无论图像的质量如何,总可以抽取得到光滑、封闭的边界. 它的基本思想是在图像上定义一个初始轮廓线,通过最小化能量函数,驱使轮廓线形变运动至目标边界. 早期的主动轮廓模型存在一定的限制,它对初始值比较敏感,尤其是不具备自动拓扑变化能力;水平集方法则通过将轮廓线看作演化曲线,能够对其拓扑变化进行很自然地处理,同时也降低对初值的敏感性[4]. 结合水平集方法的主动轮廓模型因而被广泛地应用于图像处理与计算机视觉领域.

2 主动轮廓模型方法概述

上世纪八十年代后期,Kass等人突破了传统的分层视觉模型,提出称为Snake的主动轮廓模型,开创了基于形变模型的图像处理的先河[5]. 近二十年来,相关改进和扩展研究已经不仅仅局限于最初的图像分割领域,而被越来越多的研究者成功地运用于计算机视觉的其它领域,如图像复原、运动跟踪、3D重建等等[6].

Snake是一条闭合的参数曲线C(s)=(x(s),y(s)),参数s∈[0,1],它能主动地调整其形状和位置,使能量函数达到最小[3]:

E(C)=

∫(α E

10

int

(C(s))+β Eimg(C(s))+γ Econ(C(s))) ds

其中,Snake的移动由三项共同控制:内部能量Eint确保曲线的光滑度和规则性;图像能量Eimg吸引Snake移至期望的图像特征,比如边缘;约束能量Econ指定一些求解约束. 式中的内部能量常用曲线弧长和曲率 收稿日期: 2007-06-22

作者简介: 高 梅(1964-), 女, 河北省南和县人, 讲师.

42 漳州师范学院学报(自然科学版) 2007年

来描述;后两项组成了对外部能量的描述,其中的图像能量通常定义为图像梯度的降函数,它相当于一个边缘检测器,以控制曲线在目标边缘处停止演化. 一旦给出一个合适的初始轮廓,Snake就能利用变分法收敛到能量最小. 相关的研究和改进都是围绕这个统一的能量框架而展开的.

Snake模型虽然具有传统方法所无法比拟的优点,但它也存在着一些问题和缺点,许多文献都致力于从数学模型上予以改进,或者研究新型的算法. 根据表示方式和实现方法的不同,可以分为两大类:参数主动轮廓和几何主动轮廓. 前者运用的是曲线的参数化表示,后者则运用水平集方法,已适应曲线的拓扑变化. 随着改进模型的进一步发展,人们开始将它们分类为:基于边界的分割和基于区域的分割. 本文将按照这两条发展线索,对具代表性的主动轮廓分割算法作一介绍.

3 从参数主动轮廓到几何主动轮廓

3.1 参数主动轮廓模型

经典Snake模型要求初始轮廓线距离目标边缘较近,否则在没有图像力的情况下,形变曲线将收缩为一点或一条线. Cohen等提出了所谓“气球”模型[7],在外力中增加了膨胀力来控制轮廓线的膨胀或收缩,从而使之稳定地收敛于边缘. 由于Snake的外部能量作用范围有限,无法收敛到轮廓的深度凹陷部分,因此Xu等设计了一种新的外部力GVF(Gradient vector flow)[8],此外部力在整个图像域上计算梯度场. GVF snake模型扩大了轮廓线的捕获范围,并能使它进入深度凹陷区. 求解Snake模型的一般方法是采用变分法得到Euler-Lagrange方程进行求解,常用方法有:有限差分法、有限元法、动态规划算法、贪婪算法等等.

这类早期模型都依赖于轮廓线的参数化,尽管人们作了各种改进,仍未从根本上解决存在的问题. 例如,它对初始轮廓线位置比较敏感,容易收敛至局部极值,尤其是难以处理轮廓线的分裂或合并. 基于水平集方法的几何轮廓模型就是在这样的情形下提出来的,在水平集方法中,轮廓线的拓扑变化能够得到自动处理.

3.2 几何主动轮廓模型

受曲线演化理论的启发,Caselles等[9]和Malladi等[10]分别提出了几何活动轮廓模型(Geometric Active Contours). 该模型将轮廓线看作演化曲线,通过求解其演化方程所对应的水平集函数,得到主动轮廓线的收敛位置.

基于平均曲率运动的几何主动轮廓模型由如下水平集函数的演化方程给出:

∂φ=g(|∇I|) (κ+v)|∇φ| ∂t

其中,φ为水平集函数,g为边缘检测函数,κ为轮廓线的曲率,v为约束闭合轮廓的面积的常数,同时增加演化的速度. 该模型中,轮廓线以一定的速度沿法向方向移动,然后停止在g消失的边缘上. 而在实际情况中,在边界附近的g仅仅只是减缓了曲线的演化速度,并不能使它完全停止演化. 因此曲线就有可能跨越边缘,而无法再次回到正确的边缘.

为了解决边界泄漏问题,Caselles等又提出了另一种几何形式的Snake[11],称为测地主动轮廓模型(Geodesic Active Contours). 它的能量最小化等价于测地线能量的最小化,即:寻找考虑了期望的图像特征的最短长度的测地线. 测地线模型的水平集函数形式为:

∂φ=g(|∇I|) (κ+v)|∇φ|−∇g(|∇I|)⋅∇φ ∂t

通过与前一式对比可以看出,测地线模型增加了一个额外的停止项,在边界附近∇g≠0的情况下,用该项来抵消曲率项的演化速度,以使轮廓线经过边界时彻底停止演化. 它的存在使得测地线模型可以相对自由地确定初始条件.

第4期 高 梅 , 余 轮:基于主动轮廓模型的图像分割算法 43

Saddiqi等提出在测地线模型上再增加一个“面积最小项”[12],为曲线经过边界时提供一个额外的引力,从而进一步阻止边界泄漏的情况. Xu等在水平集框架上给出了它们的参数GVF snake的公式[13],并结合诸多方法的优点,例如:增加捕获范围、能收敛于边界凹陷区、防止边界泄漏、自动适应拓扑变化等等,综合提出了几何GVF活动轮廓模型.

4 从基于边界的模型到基于区域的模型

无论是Snake还是测地线模型,都是由边界积分函数最小化来驱使轮廓线运动收敛至目标边界. 这类基于边界的方法的局限是显而易见的:首先,它的分割结果容易受到图像噪声的影响,对初始轮廓线的位置也较敏感;再者,这类方法都是依靠边缘检测函数来终止曲线的演化,而事实上,离散梯度值是有界的,停止函数g在边界上的取值并不为零,因此边界泄漏问题无法得到根本的解决;最后,它们仅依赖于轮廓线所在位置的图像局部信息来控制轮廓线的运动,难以得到全局性的分割.

与以上方法不同,基于区域的模型则利用图像区域信息来引导轮廓线的运动和停止. 这类方法的思想是:从图像模型的角度出发,给出图像模型应满足的全局能量泛函,通过最小化能量泛函来驱动轮廓线的运动. 它的一个显著优点是具有更强的抗噪性能,且能够收敛到全局最优. 4.1 基于区域分片光滑的模型

著名的Mumford-Shah模型就是一种基于区域的分割方法,它将图像看作是若干个分片光滑的区域的组合. 其主要思路是[14]:给定一幅图像I(x,y),图像分割的目标就是寻找一个由光滑区域组成的图像

u(x,y)和不光滑的边界C,使全局泛函最小:

E(u,C)=β (u−I)2dxdy+α

∫∫

Ω\\ C

|∇u|2dxdy+ Length(C)

其物理背景为:(u−I)2项可以保证u与原图像I保持内容上的基本一致,|∇u|2确保了绝大部分区域是光滑的,而Length(C)项是为了使边界长度最短,这三项的折衷保证了图像分割的最终效果. Ronfard在此模型的基础上,最早提出了基于区域策略的主动轮廓模型[15]:

E(u,C)=β

Ωin

(uin−I)2dxdy+β

Ωout

(uout−I)2 dxdy

其中,图像定义域被边界曲线C分为曲线内部域Ωin和外部域Ωout. 该能量泛函只考虑了MS泛函中的第一项,因而求解变得容易,文献采用贪婪法来求能量最小化. 它属于比较粗糙的基于区域分割方法,抗噪声能力并不强,对初始化位置依然敏感,对边界缺少规则化,而且最大的问题在于不具有拓扑自适应能力.

Chan等提出了另一种简化的MS模型,称为无边界主动轮廓模型[4]. 该模型认为图像被闭合边界划分为目标和背景两种分片常值区域,并用二相的水平集方法来进行数值求解. 无边界主动轮廓的能量泛函为:

E(C,c1,c2)=µ⋅Length(C)+v⋅Area(inside(C)) +λ1

inside(C)

|I−c1|2dxdy+λ2

outside(C)

|I−c2|2dxdy

式中,c1和c2分别为轮廓线内部区域和外部区域的平均灰度,长度约束和面积约束用于控制轮廓线的光滑度和规则度. 该方法显著提高了MS模型的性能:首先,抗噪能力增强,尤其是当两种区域的灰度差别较大时;其次,降低了初始化的要求,初始轮廓线可以置于图像任意处;最后,不依靠图像中的边缘信息,能有效分割出模糊或离散的边缘. 另外,由于水平集方法的使用,它可以自动处理拓扑变化. 随后,该方法被推广到多相水平集的情况[16]和向量值图像的分割[17]. 当然,这类算法也存在着缺点:用平均灰度来近似描述区域太过粗略,尤其是当两种类型区域的均值相似而方差不同时,无法获得理想的分割结果.

Tsai等采用了图像平滑和图像分割同时进行的策略,运用水平集方法对完整的MS模型进行了数值求

44 漳州师范学院学报(自然科学版) 2007年

解[18]. 该算法的优点是:可以自动分割出多种类型的区域,能自动处理拓扑变化. 它的缺点是:由于平滑和分割的同时进行,导致边界定位的精度降低;计算量较大;仅适用于背景比较简单的情况. 4. 2 基于区域统计特性的模型

另一类基于区域的算法是以概率统计来描述区域信息的,因此抗噪能力更强. 其中的代表是Zhu和Yuille的基于统计的区域竞争算法[19],它结合了Snake模型、“气球”模型和区域生长模型,定义了一个通用贝叶斯/MDL准则来作为能量函数:

E(Ωi,Ci,pi,N)=

∑∫

i=1

N

⎛⎜−⎝

Ωi

logpi dxdy+

v⎞Length(Ci)+e⎟ 2⎠

其中,子区域Ωi用概率密度函数pi来描述,N为区域类数. 第一项保证每个像素归属正确类别的全后验概率最大,第二项是边界的规则性约束,第三项的常数e是固定的惩罚项. 该方法通过引入一个区域生长步骤来处理区域的合并. 随后Yezzi等提出了类似的算法,并采用水平集形式予以实现[20],它的工作仅涉及了双模型、三模型的情况.

Samson则采用水平集函数对每一组边界和区域进行建模,提出了针对多区域的有监督纹理分类算法

[21]

,其最大改进是直接给出了水平集形式的能量函数:

E(φi,pi)=

∑∫

i=1

N

vλ⎛⎞

⎜−H(φi)logpi+g(|∇I|)|∇H(φi)|⎟ dxdy+Ω22⎝⎠

∫∑

i=1

⎜Ω⎜⎝

N

H(φi)−1⎟⎟dxdy

2

其中,H( )为Heaviside函数,式中增加了对重叠和真空区域的惩罚项,每条轮廓线通过这一项与其它轮廓线相耦合. 假设各区域特性服从高斯分布,能量函数的最小化给出了最大后验概率划分. Aujol等将此算法推广到有监督纹理分割[22],采用了更为复杂的通用高斯分布进行概率密度估计,并取消了能量函数中的边缘检测停止项. Brox等也采用最大化后验概率准则,提出了二区域的无监督纹理分割算法[23];并进一步结合Zhu算法中区域竞争的概念,将二区域分割算法扩展到了多区域纹理分割[24]. 4.3 边界与区域综合的模型

在Zhu算法的启发下,Paragios等提出了测地主动区域模型(Geodesic Active Regions)用于有监督纹理分割[25]. 它的基本思想是将区域信息加入测地主动轮廓模型,来构成一个基于边界和区域的综合模型. 其能量函数表示如下:

N

N

E(Ci,pi)=α∑∫−logpi dxdy+(1−α) ∑∫ g(pB,i(Ci(si),σB)|Ci′(si)|dsi

i=1

Ωi

i=1

0

1

式中的前一项为基于概率统计的区域信息,后一项为包括边缘检测项和规则约束项的测地主动轮廓模型. 为了更好地考虑多区域分割时的不相交约束,Paragios等在相应的水平集运动方程中增加了一个耦合外力

[26]

,来避免演化过程中的区域重叠情况,同时该模型被扩展到无监督纹理分割. 河源等也采用高斯混合模

型来描述特征图像的统计分布[27],运用测地线主动区域模型实现了无监督的纹理分割. 4.4 多区域的分割模型

正如上文所述,在很多场合,仅仅把图像分割背景和前景两种区域是不够的. 采用水平集方法来解决多区域分割问题的主要方法有:1)一种直接的方法是为每个区域设置一个水平集函数,同时增加一个耦合项,以消除区域之间的重叠和真空现象. 文献[21]在能量函数中增加了耦合项,而[26]则是水平集函数的迭代方程中直接增加耦合项. 2)文献[28]提出了一种完全不同的思路,以递归的方式每次使用一个水平集函数将所有区域一分为二,最终用n个水平集函数来表示N=2^n个区域. 它不仅减少了水平集函数的个

第4期 高 梅 , 余 轮:基于主动轮廓模型的图像分割算法 45

数,而且避免了区域分离的约束,但是,它仅适用于区域数目为2的指数的情况. 3)Chung等提出使用不同值的水平集来表示不同的轮廓线[29],仅用一个水平集函数就可以表示N个区域. 4)Jeon等提出用层次方法来实现多区域分割[30],每次以亮度方差为标准选择一个区域,运用水平集函数将它一分为二. 龚永义等则通过跟踪零水平集的分裂情况,对不同的准目标区域区别处理,同时通过估计可能的目标区域来促使零水平集的充分分裂,来实现多目标轮廓的提取[31].

5 结论

主动轮廓模型为图像分割问题提供了一个统一的解决框架. 相比于传统的分割方法,主动轮廓模型综合考虑了几何约束条件,以及与图像数据、轮廓形状等相关的约束条件,来共同驱使轮廓形变至目标边界. 它可以较好地克服传统分割算法中边缘不封闭、噪声敏感等缺点,获得更加自然的分割效果. 结合水平集方法的主动轮廓模型能够自适应地处理轮廓线在演化过程中的拓扑变化,而且进一步减少图像噪声的干扰. 近几年来,主动轮廓模型被越来越多地应用到纹理图像分割中[32],它可以有效地结合区域和边界信息,在无监督或有监督条件下获得单像素宽度的边界曲线,具有比聚类等方法更高的分割精度. 而对于纹理分类而言,其分割问题已不仅仅局限于感兴趣目标的提取. 目前,多区域的主动轮廓线模型已成为图像分割领域一个新的研究热门.

在多区域的主动轮廓模型中,需要解决两个关键问题:1)如何构建多区域的能量函数,并建立各能量函数之间的耦合;2)如何提高求解迭代的效率,减少算法复杂度. 从应用的角度来讲,后者问题尤显突出. 由于水平集函数的演化取决于轮廓线附近窄带区域的像素特性,因此,轮廓线初始化问题是影响收敛速度的另一重要因素. 总之,多区域主动轮廓模型是目前尚未完善,且具挑战性的方法. 合理设置初始轮廓线,以及提高算法的收敛速度等问题需待进一步地深入研究.

参考文献:

[1] 章毓晋. 图象分割[M]. 北京: 科学出版社, 2001.

[2] 张 亶, 陈 刚. 基于偏微分方程的图象处理[M]. 北京: 高等教育出版社, 2004.

[3] M. Kass, A. Witkin, and D. Terzopoulous. Snake: Active contour models [J]. International Journal of Computer Vision, 1988,

1(4): 321-331.

[4] T. Chan and L. Vese. Active contour without edges for vector-valued image [J]. Journal of Visual Communication and Image

Representation, 2001, 10(2): 266-277.

[5] 李培华, 田 文. 主动轮廓线模型(蛇模型)综述[J]. 软件学报, 2001, 11(6): 751-757.

[6] 查宇飞, 张 育, 毕笃彦. 基于区域活动轮廓运动目标跟踪方法研究[J]. 中国图象图形学报, 2006, 11(12): 1844-1848.

[7] L. D. Cohen. On active contour models and balloons[J].Computer Vision. In: Graphics and Image Processing: Image

Understanding. 1991, 53(2): 211-218.

[8] C. Xu, A. Yezzi, and J. L. Prince. On the relationship between parametric and geometric active contours[J]. In: Proceedings of

34th Asilomar Conference of Signals, Systems, and Computers. 2000, 483-489.

[9] V. Caselles, F. Catte, T. Coll, and F. Dibos. A geometric model for active contours in image processing [J]. Numerische

Mathematic. 1993, 66: 1-31

[10] R. Malladi, J. A. Sethian, and B. C. Vemuri. Shape modeling with front propagation: A level set approach [J]. IEEE transactions

on Pattern Analysis and Machine Intelligence. 1995, 17(2): 158-175.

[11] V. Caselles, R. Kimmel, and G. Sapiro. Geodesic active contours [J]. International Journal of Computer Vision. 1997, 22(1):

61-79. [12] K. Saddiqi, Y.B. Lauziere, A. Tannenbaum, and S.W. Zucker. Area and length minimizing flows for shape segmentation [J].

IEEE transactions on Image Processing. 1998, 7(3): 433-443. [13] C. Xu, A. Yezzi, J.L. Prince. On the relationship between parametric and geometric active contours[J]. In: 34th Asilomar

Conference of Signals, Systems, and Computers. 2000, 483-489.

[14] D. Mumford, J. Shah. Optimal approximation by piecewise smooth functions and associated variational problems[J]. In:

Communications on Pure and Applied Mathematics, 1989, 42: 577-685.

46 漳州师范学院学报(自然科学版) 2007年 [15] R. Ronfard. Region-based strategies for active contour models [J]. International Journal of Computer Vision. 1994, 13: 229-251. [16] 郑 罡, 王惠南. 基于水平集对多相活动轮廓图像分割模型[J]. 南京航天航空大学学报: 英文版. 2006, 23(2): 132-136. [17] T. Chan and L. Vese. Active contour without edges for vector-valued image [J]. Journal of Visual Communication and Image

Representation. 2001, 11: 130-141.

[18] A. Tsai, A. Yezzi, and A. S. Willsky. A Curve evolution approach to smoothing and segmentation using the Mumford-Shah

function[J]. In: Proceedings of International Conference on Computer Vision and Pattern Recognition. 2000, 1: 119-124.

[19] S. C. Zhu and A. Yuille. Region competition: unifying snakes, region growing, and Bayes/MDL for multi-band image

segmentation [J]. IEEE transactions on Pattern Analysis and Machine Intelligence. 1996, 18(9): 884-890.

[20] A. Yezzi, A. Tsai, and A. S. Willsky. A statistical approach to snakes for bimodal and trimodal imagery[J]. In: Proceedings of 7th

International Conference on Computer Vision. 1999, 898-903.

[21] C. Samson, L. Blanc-Feraud, G. Aubert, and J. Zerubia. A level set model for image classification [J]. International Journal of

Computer Vision. 2000, 40(3): 187-197.

[22] J. F. Aujol, G. Aubert, and L. Blanc-Feraud. Wavelet-based level set evolution for classification of textured images [J]. IEEE

transactions on Image Processing. 2003, 12(12): 1634-1641.

[23] M. Rousson, T. Brox, and R. Deriche. Active unsupervised texture segmentation on a diffusion based feature space[J]. In:

Proceedings of 2003 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2003, 699-704.

[24] T. Brox and J. Weickert. Level set based image segmentation with multiple regions [J]. Pattern Recognition, Springer LNCS

3175. 2004, 415-423.

[25] N. Paragios and R. Deriche. Geodesic active regions for supervised texture segmentation[J]. In: Proceedings of International

Conference on Computer Vision. 1999, 2: 926-932.

[26] N. Paragios and R. Deriche. Coupled geodesic active regions for image segmentation: A level set approach[J]. In: Proceedings

of the European Conference in Computer Vision, 2000, 2: 224-240.

[27] 河 源, 罗予频, 胡东成. 基于测地线活动区域模型的非监督式纹理分割[J]. 软件学报. 2007, 18(3): 592-599.

[28] L. Vese and T. Chan. A multiphase level set framework for image segmentation using the Mumford and Shah model [J].

International Journal of Computer Vision. 2002, 50(3): 271-293.

[29] J. Chung and L. Vese. Image segmentation using a multilayer level-set approach. Technical Report CAM-03-53, Department of

Mathematic, UCLA, 2003.

[30] M. Jeon, M. Alexander, W. Pedrycz and N. Pizzi. Unsupervised hierarchical image segmentation with level set and additive

operator splitting [J]. Pattern Recognition Letters, 2005, 26: 1461-1469.

[31] 龚永义, 罗笑南, 黄 辉, 廖国钧, 张 余. 基于单水平集的多目标轮廓提取[J]. 计算机学报. 2007, 30(1): 120-128. [32] 尤建洁, 王平安, 夏德深. 结合活动轮廓模型的无监督文理图像分割[J]. 计算机辅助设计与图形学学报. 2006, 18(12):

1897-1903.

Review on Active Contour Model Based Image Segmentation

GAO Mei1 , YU Lun2

(1.Department of Sparetime Correspondence, Fujian Institute of Economics and Management, Fuzhou, Fujian 350002, China;

2.College of Physics and Information Engineering, Fuzhou University, Fuzhou, Fujian 350002, China)

Abstract: Active contour model is one of the popular methods in the field of image segmentation recently. The remarkable advantage is that smooth and closed edge always can be extracted regardless of the image quality. This paper summarizes the development the active contour model method, and analyzes the features of main relation algorithms. Furthermore, both the possible research directions and several key problems expected to be solved in the future work are discussed. Key words: Image Segmentation ; Active Contour Model ; Level Set Method ; Texture Segmentation

[责任编辑:周两边]

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- azee.cn 版权所有

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务