所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

利用组织病理学图像分析进行癌细胞检测

Aashna耆那教徒的1, Shwetal Atey2, Satender Vinayak3., Varun Srivastava4
  1. GGSIPU, BVCOE, Paschim Vihar,印度新德里,计算机科学系UG学生
  2. 印度新德里巴瓦纳路,德里理工大学计算机科学系UG学生
  3. 印度新德里,GGSIPU, BVCOE, Paschim Vihar,计算机科学系助理教授
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际计算机与通信工程创新研究杂志

摘要

组织病理学是指病理学家使用显微镜对活检样本进行分析和分类的检查。为了研究疾病的表现,组织病理学图像的分析是由病理学家手动完成的,因此诊断是主观的,在很大程度上取决于专业人员的专业水平。为了克服这一可能的错误诊断和早期检测的问题,需要一个自动化的计算机化图像处理系统对活检样本进行定量诊断。在本文中,我们提出了一种早期癌细胞检测模型,并对图像预处理、图像分割、特征提取和分类进行了回顾和总结。



关键字

图像处理,图像分割,癌细胞检测,特征提取,组织病理图像分析,活动轮廓模型,形态特征提取,计算机辅助诊断

介绍

早期癌细胞检测使用组织病理学图像的特点是识别异常失控的细胞。受损细胞分裂繁殖形成良性(非癌变)或恶性(癌变)的肿瘤。细胞形状的扭曲和细胞簇的密度是身体组织中存在恶性肿瘤的标志。所提出的自动化系统利用形态特征分析,即细胞形状分析,以检测和分类细胞为癌变或非癌变。
整个过程分为图像预处理、图像分割、特征提取和分类几个阶段。
为了确定图像的焦点区域,图像预处理主要包括去除不必要的噪声和增强图像。为此,我们采用了膨胀和侵蚀等技术。同时应用中值滤波和阈值技术。
预处理后,对图像进行分割,以提取清晰的细胞边界,以便进一步处理。分割方法主要有基于区域的、基于纹理的、基于梯度轮廓的、基于活动轮廓的等。我们采用了活动轮廓模型[2]的Chan-vese实现。细胞的重叠和连接聚类是分割领域普遍存在的主要问题。
对分割后的图像进行特征提取。在这一阶段,我们提取和分析了纹理和形态特征。纹理特征提取和分析使用灰度共生矩阵(GLCM),这是最常用的纹理分析技术之一。
形态特征分析,即细胞形状分析已成为细胞图像处理和模式识别的必要手段。其主要目的是定量表征细胞形态异常鉴定和分类。它构成了早期癌症检测程序的主要部分。
最后一个阶段是关于细胞是否癌变的分类。许多有监督和无监督技术可用于基于提取的特征对元素进行分类/聚类。一些著名的技术是K-means,模糊c-means,超级向量机(SVM),神经网络,决策树等。我们采用通用分类器神经网络(GCNN)模型对[1]进行分类。

相关工作

Ahmad Chaddad et al[5]于2011年4月从分段多光谱纹理生物图像中提取了Haralick 's纹理特征和形态学参数用于结肠癌细胞分类。他们使用了概率神经网络(PNN),其激活函数是一个测量未知变量到所有已知类变量距离的函数
Baouchan Pang等[8]于2010年10月提出了一种基于卷积网络的彩色组织学图像细胞核分割的机器学习技术。他们使用梯度下降算法,卷积网络,每个隐藏层有3个隐藏层,每个隐藏层有8个特征图,从背景中分割细胞。
2008年7月,Akif Burak Tosun等[9]提出了一种基于被定义为代表组织成分的对象分布的同质性度量。利用这种方法,他们展示了一种新的面向对象分割算法,因此,实现了用于癌症检测的活检图像的无监督分割的面向对象纹理分析。
2000年5月,T.S. Furey等[10]利用支持向量机(SVM)对使用微阵列表达数据的癌症组织样本进行分类和验证。
2014年3月,M.Dhivya等[11]使用支持向量机(SVM)分类器,通过组织病理学图像分析来检测癌症。
2012年8月,a.d. Belsare等[7]回顾了用于癌症检测和分类的计算机辅助组织病理学图像分析的各种技术。

方法

A.图像预处理
这一步的主要目的是去除图像中存在的大量随机噪声,以确定需要执行数学运算的焦点区域。因此,中值滤波用于增强图像质量,即增加前景(感兴趣区域)与背景之间的对比度,然后使用阈值技术来降低噪声。在阈值分割中,图像的强度矩阵用于识别低于阈值的像素,这些像素被认为是有噪声的。这些阈值可以通过使用几种计算技术自动确定。我们已经使用大津方法来确定一个最优阈值,以使类间方差[8]最大化。
B.图像分割
分割可以基于区域和边界。我们使用了这两种方法,因为每种方法都有各自的局限性。
基于区域的方法包括阈值技术,该技术用于从背景中分离细胞,但它很少分离重叠的细胞。为此,采用分水岭算法检测重叠单元间的边界。
在各种基于边界的技术中,活动轮廓模型被证明是非常强大的,特别是当图像中存在不规则形状(如癌细胞)时。在这种方法中,我们从一些初始轮廓开始,由一个选定的函数定义。我们描述了两个主要区域,即轮廓内面积和轮廓外面积。然后我们在一些水平集函数的基础上发展这条轮廓。我们的目标是通过改变函数的参数来优化这个函数。利用Chan-Vese分割[2]方法对图像进行两相分段常数模型的最优拟合。这是一个很好的主动轮廓模型的实现,不像其他方法,这种方法不依赖边缘检测。分割边界用水平集函数表示。在这里,我们使用能量拟合函数作为水平集函数,具有以下四个参数:-
1.灰色/RGB内轮廓的变化
2.灰色/RGB外轮廓的变化
3.等高线长度
4.轮廓线内面积
我们对上述四个参数进行了惩罚。由于所有这些参数都有一个最小值为零,我们通过改变这些参数值来优化函数。我们对最希望优化的参数给予较高的百分比,同时对其他参数给予松弛。例如,为了尽量减少轮廓内部的变化,即根据RGB/Grey尺度值分割尽可能均匀的区域,然后相应地设置其相应参数的值,赋予其较高的百分比值。图像描述为I,其域为Ω,则φ: Ω ->IR,函数H(φ)称为Heaviside函数,定义为:
H(φ)=1,如果φ >=0
=0,如果φ <0
使用的水平集函数(即能量拟合函数):-
图像
其中,第1项是表示轮廓长度的积分项,μ是赋予该参数的权重。因此,组合术语描述了对轮廓总长度的惩罚。同样,第2项表示对轮廓内总面积的惩罚,第3项表示对轮廓内面积变化的惩罚,第4项表示对轮廓外面积变化的惩罚。
图像
c1和c2分别表示等高线内外面积的平均值。
不同类型的初始化可以进行,如单个大圆,多个圆等。但必须记住,初始轮廓的收敛会影响最终的分割或输出。
我们使用统一连续函数初始化:-
图像
Chan-Vese方法分割算法[2]:-
1.初始化f的值
2.重复大量的迭代
3.计算f的当前值c1和c2
4.根据得到的新值更新f
5.计算fn和fn-1之间的差值
6.如果此差值小于阈值
7.然后打破这个循环
8.重新初始化(可选)
在上面的例子中,清晰的段边界是使用活动轮廓模型定义的一个由随机的圆模式组成的一般图像。其中μ = 0.5, λ1 = 1, λ2 = 1, ν保持不变。由于μ值保持较低,因此边界不精细或对轮廓长度惩罚不大。因此,它分割单个细胞。
使用相同的方法,我们分割形成特征分析的主要输入的单个细胞。
C.特征提取
从图像中分割细胞后,我们对这些细胞进行形态学分析。形态特征是几何特征。采用8个形态学参数对节段细胞进行分类。这些参数包括:—
1.面积-单元格中像素的总数。
2.周长-像素的总数,目前在一个单元格的边界。
3.Xor cell-circle-应用于cell和具有相同面积和质心的圆之间
4.Xor cell-凸-它应用于单元格和覆盖单元格的凸之间。
5.坚固度-它被定义为一个细胞的核面积的比率,它的细胞面积。如果细胞异常,细胞核的大小就会增大,因此,坚固度也会增加。
6.Xor cell-rectangle-它应用于分段单元格和覆盖它的矩形之间。
7.沿着x轴的标准差-如果细胞是癌变的,那么细胞的分布就会受到干扰,因此存在随机分布,如果沿着任何一条轴的Std发展很高,那么就有可能发生癌症。
8.y轴上的标准差-解释同上。
图7为输入图形,图8为相应的xor-cell-circle、xor-cell-convex和xor-cellrectangle输出。
d .分类
分类是根据每个细胞提取的特征进行的。我们为每个细胞提取8个形态特征,并将每个特征排列在二维数组中,每列代表一个细胞,行对应所考虑的8个形态特征-面积,周长,XOR细胞-圆,XOR细胞-凸,固体度,XOR细胞-矩形,x方向的标准差和y方向的标准差。我们采用通用分类器神经网络(GCNN)模型[1]对癌细胞和非癌细胞进行分类。
GCNN是由Buse Melis Ozyildirim和Mutlu Avci于2012年提出的一种基于径向基函数的分类神经网络。该神经网络采用基于平滑参数优化的梯度下降算法。它有5层;输入,模式,求和,归一化和输出。对于每个图案层神经元,分配一个平滑参数。更新平滑参数,使获胜神经元的误差平方收敛到全局最小值[1]。GCNN利用每个模式层神经元的目标值,并提供基于回归的有效分类。

结论

在某些情况下,图像包含高水平的噪声,活动轮廓模型不能给出清晰的分割边界的细胞。此外,由于它的工作原理是能量函数的优化,在某些情况下,单元内的区域和单元外的区域对于特定的能量函数显示相同的值,因此ACM在这种情况下无法准确工作。图像分辨率低、模糊度增加和细胞过度重叠也是细胞分割过程中存在的问题。
分水岭算法以及各种阈值和滤波技术可能会导致图像失真,其形式是模糊或不必要地从图像中删除一些细胞。此外,在某些情况下,对于给定特征(如灰度值)的特定测量,细胞和背景等离子体都具有相同的值。在这里,细胞的边缘和等离子体的边缘没有明显的区别,因此可能导致不准确的结果。
在特征提取阶段面临的另一个问题是系统无法区分单核和多核细胞,因此两者被视为相同。GCNN被证明可以与其他著名的用于分类和聚类的神经网络模型相媲美,如自组织映射(SOM)、概率神经网络(PNN)、广义回归神经网络(GRNN)等。使用所描述的方法,我们成功地分割图像以指示清晰的细胞边界,并根据提取的特征将每个细胞分为相应的癌性和非癌性类型组。

数字一览

图1 图2 图3 图4
图1 图2 图3 图4
图1 图2 图3 图4
图5 图6 图7 图8

参考文献












全球科技峰会