关键字 |
着丝粒、染色体核型分析、对象坐标,遗传性疾病 |
介绍 |
细胞核的DNA分子塞进丝像结构被称为染色体。每个染色体都是捏造的DNA,多次紧紧蜷缩在蛋白质被称为组蛋白,其结构提供支持。细胞核染色体是不可见的,甚至在显微镜下的细胞不分裂。然而,DNA组成染色体在细胞分裂变得更加紧密,然后在显微镜下可见。大多数研究人员了解染色体被注意到发现染色体在细胞分裂。每个染色体都有收缩点所谓的着丝粒,将染色体划分为两个部分,或“武器”,如图1所示(一个)[1]。染色体的短臂/上臂贴上“p_arm。“染色体的长臂/下臂贴上“问_手臂。“在人类中,每个细胞通常含有23对染色体,总共46。22这些成对的,称为常染色体,在雄性和雌性。 The 23rd pair, the sex chromosomes, differs between males and females. The picture of the human chromosomes lined up in pairs is called karyotype as shown in fig 1(b) [1]. |
核型分析,一个经典的程序面对人类染色体的图像诊断的目的,是一个长期,然而常用技术在细胞遗传学。自动化染色体分类过程是设计一个自动核型分析系统的初始步骤,一些著名的基因异常也与染色体缺陷。除了一些著名的基因异常喜欢非整倍性(不当的染色体数目),易位,删除,一些致命的病理条件像白血病也与染色体缺陷。核型分析过程通常是由专家临床医师完成手动查看图像,识别染色体,砍下来,把它们在指定位置的核型。尽管显带技术的增长,核型分析仍然是一个困难和耗时的过程必须由一个有经验的操作人员或细胞遗传学专家。然而,自动核型分析仍然被认为是一项艰巨的任务主要是由于形状变化引起的染色体的非刚性的本质,给他们一个不可预知的表象在图像。 |
一些几何和形态学特征,如染色体的长度最初用于分类成少数群体。然后,运用一些简单的盛行着丝粒的位置等的位置和宽度特征乐队和他们的位置相对于着丝粒和/或相对于彼此,人类的专家可以有效地识别和确定每个染色体。许多发表的算法试图探测着丝粒的位置通过检测染色体沿中心线的收缩。风笛手和叶绿体基粒[2]走近这通过二次矩沿中心线。用类似的方法,王等人使用这些扫描线或框架结构的垂直于染色体的中心线提取形状轮廓,轮廓宽度(宽度测量)的集合,以及染色体的条带模式[3]。 |
特征频带的概念在这一过程中是非常重要的。基于本研究的调查,一个乐队的水平的重要性主要是由以下三个因素决定的[6]: |
(1)带的宽度。 |
(2)强度的乐队。 |
(3)的相对位置。 |
也报道,大多数研究自动分类是基于投影向量方法,自动化的着丝粒的位置和中轴变换(垫)(4、5、6)。在实践中,使用垫或其他形态操作对象变薄等往往会产生不良的结果由于染色体的形态变化。这种差异在骨架化过程中往往会产生虚假的分支。Hassouna和法拉克提出了一个三维对象的方法获取一个健壮的框架使用一种新型骨架化算法似乎包括内置修剪显然能力[7]和权证未来的调查。垫基础算法的主要缺点是计算成本和不支持的图像边界的不规则。投影向量法不能应用于高度弯曲的图片和近端着丝染色体图像。自动核型分析包含两个主要阶段,人类染色体的分割和分类。集群人类男性染色体图像是图2所示。核型分析过程的结果由一个手动完成cytogeneticist图3所示。 |
该方法 |
该算法图4所示使用对象的坐标定位着丝粒轮廓提取算法,计算人类中期染色体的相对长度。 |
该算法可以在功能上分为如下七个任务 |
1)输入图像从显微镜。 |
2)图像预处理。 |
3)全变差正则化。 |
4)分割过程。 |
5)从一个文件夹读取染色体。 |
6)矫直过程。 |
7)创建二进制图像 |
8)对象坐标轮廓提取 |
9)制表每个染色体的着丝粒指数与相对长度; |
答:输入图像从显微镜 |
染色体图像捕获从显微镜和数码相机前面图2所示。一些染色体图片不清楚,有些重叠由于细胞培养、染色体,染色体染色和显微镜的照明。所以之前的图片需要处理产生的二进制图像。 |
b图像预处理 |
图像预处理是一个过程,修改和准备使用的图像中的像素值的算法。原染色体中期细胞照片是RGB图像。这里的RGB图像转换为灰度图像(1) |
Ig r = 0.299 + 0.587 g + 0.114 b。(1) |
whereIg是灰度图像和R, G, B是红色,绿色,蓝色组件,分别。噪声在图像被使用平均滤波器抑制。直方图均衡化是用于提高对比度和图像质量。最后,每个染色体被安排和保存进行进一步处理。 |
c .全变差正则化 |
在信号处理,总变分去噪,也称为全变差正则化是一个过程,最常用于数字图像处理、勤奋努力的噪声去除。它是基于信号和奢侈的规则可能不确实的细节有很高的全变差,也就是说,坚固的斜坡信号的积分很高。根据这一原则,减少图像的总变异受原始图像这是一场势均力敌的比赛,摆脱不良点而维护重要的细节,如对象。这个概念是由鲁丁et al . 1992年[8]。这噪音消除技术优势简单线性平滑、中值滤波等技术,减少噪声,但同时消除对象或多或少。相比之下,全变差同时去噪非常有效的保护对象同时平滑掉噪声在平坦地区,即使在低信噪比[9]。 |
d .分割过程 |
图像分割是一个过程,从背景部分感兴趣的地区。阈值法是一种广泛使用的图像分割技术。这些技术领域对象通过寻找灰度值(0 - 255)在阈值矩阵的每个元素,改变他们使用首先进行一个新的算法。在染色体分析,分割过程是用来分割重叠和动人的染色体。因为它提供重叠的染色体的数量用于检测数值畸变数据集。 |
e染色体图像从一个文件夹读取 |
如图5所示,虚拟仪器软件工具的帮助下,整个文件夹的图像可以阅读,可以减少处理时间。 |
最初应用的文件夹路径作为输入,提供文件夹的路径开始。的最终路径,输入文件夹的图像可以被检索的帮助下带路径的功能。然后文件夹列表函数提供的数组中所有图片路径文件夹。 |
f .矫直过程 |
一些出现在中期染色体分散不直视这将提供使用该算法效果最好。,弯曲的染色体识别&直之前应用对象作为输入坐标轮廓提取算法。染色体区域弯曲伸直使用像素迁移的概念。弯曲的染色体的长度可以计算使用虚拟仪器视觉助手。距离可以基于欧式距离计算。的计算长度和距离是图6所示。弯曲的染色体可以自动识别使用以下[10]。表1显示了曲线的分类基于染色体长度和距离。 |
搬迁后的像素,弯曲的染色体看起来如图7所示(一个),7 (b)。 |
g .二进制图像阈值 |
对图像分割的阈值是最简单的过程。对于灰度图像,阈值用于创建二进制图像。在阈值过程中,每个像素在图像如果他们命名为“对象”像素值大于阈值(假设一个对象比背景)是固定的手动或通过直方图计算和“背景”像素。这种模式称为阈值以上。变体包括阈值以下,这是相反的阈值之上;阈值内,一个像素标记为“对象”,如果它的值是两个阈值和阈值外,这是相反的阈值在通常情况下,一个对象给出了像素值为“1”,而背景像素值“0。“最后,创建一个二进制图像每个像素着色与白色或黑色,根据像素的标签。这里解释细节被包括的子VI软件实现自动读取文件夹的图片。然后,的帮助下写表达VI函数,整个转换成二进制输入文件夹的图像自动写入一个新的文件夹路径。 |
H。对象坐标轮廓提取算法 |
VInitially二进制图像应用的文件夹路径作为输入。基于强度值,图像信息转换成像素值。检索的对象坐标是基于阈值固定的图像信息。从对象坐标(X, Y),垂直坐标(Y)分别检索。然后从垂直坐标连续相同的元素数组(Y)合并计算连续相同的元素的总数在方程(2),对象坐标轮廓提取算法在图9中。 |
实际上这个算法遍历行智慧在一个矩阵坐标存储与检索的对象连续相同的元素。甚至有不规则边界一个图像,这提供了准确的结果确定着丝粒的位置。这里的比例近10合并垂直坐标顶部和底部的对象图像的坐标得到消除避免误认的着丝粒位置高度的姐妹染色单体。 |
数控=总数连续相同的元素从垂直坐标(2) |
从数控数组,最小距离作为centromere.i.e对象标识 |
着丝粒= min (Nc)的数组。(3) |
垂直坐标(Y)数控的最低被确定为着丝点坐标。着丝点坐标(Yc),最大最小值Y坐标(Ymax Ymin)计算相对长度的确定。 |
长度可以计算为: |
|
实验结果 |
处理的可视化表示输出图10所示。即使输入图像RGB图像,在RGB的帮助下灰度转换方法,应用输入图像为灰度图像,如图10所示(一个)。基于灰度的图像强度转化为二进制图像在fig10 (b)。图10 (c)显示了对象的坐标的程序可以做到的。对象坐标存储在一个矩阵的格式。的帮助下,矩阵,坐标计算在每一行中显示fig10 (d)。因为为了避免姐妹染色单体的高度,几行坐标得到消除fig10所示(e)。坐标计算的总数中对于每一行,一行被认为是着丝粒的行坐标的总数是最低的。Fig10 (f)与黄线显示了着丝粒位置指示器。图10 (g)显示了相对长度计算的方法。 |
着丝粒指数和两臂的长度为一个对象获得的染色体图像坐标轮廓提取算法,最小宽度和相对长度的计算。不同的图像的相应的结果如表2所示。虚拟仪器软件工具的帮助下,整个过程是自动的处理时间7秒一个数据集,包括近46条染色体。由于对象坐标计算在每一个对象,该算法为弯曲的染色体也提供了最好的结果。 |
结论 |
自动化的染色体在细胞遗传学分类是一个重要的任务。之前已有无数人尝试描述染色体进行临床和癌症细胞遗传学研究。摘要一个高效的算法寻找着丝粒位置和计算的相对长度自动使用虚拟仪器。由于矫直过程中,着丝点的准确位置和两臂的长度精确获得使用此算法的投影向量法等算法相比,中轴变换和骨架化算法。计算复杂度也减少了该方法。在我以前的工作中,我使用边缘坐标轮廓提取算法,姐妹染色单体消除顶部和底部还没有完成。该算法还执行对所有类型的人类染色体图像以最小的误差。由于连续几个相同的元素图像的顶部和底部都消除,这种算法适用于高度的姐妹染色单体以及近端着丝染色体类型。这个分析,这项工作可以扩展到确定的染色体数目和结构异常等特定疾病癌症,可以发现唐氏综合症。 |
表乍一看 |
|
|
表1 |
表2 |
|
数据乍一看 |
|
|
|
|
|
图1 |
图2 |
图3 |
图4 |
图5 |
|
|
|
|
图6 |
图7 |
图8 |
图9 |
|
引用 |
- www.nature.com/scitab
- 风笛手和e .叶绿体基粒”全自动特性测量带状染色体分类,“血细胞计数,10卷,第255 - 242页,1989年。
- x,郑,s . Li j . j . Mulvihill h·刘,“一个基于规则的计算机方案着丝粒识别和极性中期染色体,转让”第一版。生物方法程序。地中海。卷。89年,33-42,2008页。
- Jau-hong花王,Jen-hui壮族∗TsaipeiWang,“染色体分类基于乐队沿着近似内侧轴剖面相似性”,模式识别,www.elsevier.com/locate/pr 41 (2008) 77 - 89。
- Moradi, M。,Setarehdan, S.K., Ghaffari, S.R., 2003. Automatic locating the centromere on human chromosome pictures. In: Proceedings of the 16th IEEE Symposium on Computer-Based Medical Systems (CBMS’03) 1063-7125/03 $17.00 © 2003 IEEE.
- m . Moradi”栏目Setarehdan,新功能对人类染色体的自动分类:可行性研究,Recogn.Lett模式。27 (1)(2006)19-28。,www.elsevier.com/locate/patrec.
- m . s . Hassouna a·a·法拉克,“变分曲线骨架使用梯度向量流。”IEEE反式。模式肛门。马赫。智能。没有,卷。31日。12日,页。2257 - 2274年,2009年12月。
- 鲁丁,l . i;Osher,美国;法特米,大肠(1992)。“基于非线性全变差的噪声去除算法”。自然史D60:259 - 268。
- 强,d;Chan t (2003)。“Object-preserving和全变差正则化的尺度特性”。逆问题19:S165 - S187
- 质的和s . k . Setarehdan”自动识别和矫正弯曲的人类染色体的图像算法”,在出版社,在《生物医学工程应用,基础和通信、世界科学出版、没有DOI: 10.1142 / S1016237212500469,接受2012-05-13
- AkilaSubasingheArachchige JagathSamarabandu,琼·h·m·诺尔和彼得·k·罗根强度“综合Laplacian-Based厚度测量检测人类中期染色体着丝粒位置”,IEEE生物医学工程、60卷,没有。2013年7月7日。
|