所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

基因调控网络的重建确定预后分子标记的乳腺癌和前列腺癌的活性基质利用信息理论方法

尚Mahesh教授1Neha Mangla博士2Pooja V3,亚斯Bhyratae4
伊势,心房理工学院,班加罗尔,印度卡纳塔克邦
相关文章Pubmed,谷歌学者

访问更多的相关文章国际期刊的创新在计算机和通信工程的研究

文摘

基因调控是指一系列连续的过程,最知名和理解翻译和转录,控制基因的表达水平,最终结果与特定数量的目标蛋白质。基因调控网络的重建是一个分析的过程所涉及的步骤使用计算技术基因调控。摘要癌症特异性基因调控网络已经使用信息理论approach-Mutual重建。基因微阵列数据库使用包含12个样品每个乳腺癌和前列腺癌有正常和肿瘤细胞的信息。这个数据预处理,规范化和过滤用t检验;MI值应用于过滤基因决定基因基因的相互作用。基于交互,10个不同网络构建和统计分析,网络上已经完成。最后,验证可用的推断结果已经完成生物数据库和文献。

关键字

基因调控网络,微阵列,乳腺癌和前列腺癌的活性基质,互信息

我的介绍。

恶性肿瘤是最常见的疾病之一,在当今世界,影响人类的死亡率。癌变的细胞分裂和生长在一个无法控制的方式形成肿瘤,再加上附近的身体的一部分。各种重要的基因负责不同肿瘤的起源。放疗、化疗和手术是治疗癌症的方法。因此,识别的基因导致癌症通常解决的无法控制的发展处于初级阶段。
重建g e n e r e g u l t或y n etwor ks(入库单)显式地代表发展的因果关系或监管的过程。它已成为一个具有挑战性的计算问题对理解复杂的监管机制在细胞系统。分子生物学的一个重要问题是识别和理解基因调控网络(入库单)。微阵列技术产生了大量的基因表达数据,提供机会了解底层的监管机制。
最近,越来越多的信息理论方法被用于重建入库单。几种基于互信息的方法已经成功地应用于推断入库单和minet。一般来说,这些方法首先计算两两之间的管理信息系统的所有可能的双基因,导致MI矩阵。MI矩阵然后操纵识别监管的关系。MI提供了一个相关的自然推广,因为它措施非线性依赖,因此吸引了太多的关注。这些方法的另一个优势是他们的能力来处理数以千计的变量(基因)的有限数量的样本。与这些优点,MI-based方法只有在调查双向规定入库单。基因网络的推理从高通量数据是一个非常复杂和极大地扩大;引发的测量技术的发明。为了提供一个系统的基本原则的讨论我们限制本文观察稳态基因表达数据和考虑相关性和相互informationbased推理方法。 These methods are representative of linear and non-linear methods. Principally, there are three fundamental levels of a molecular system as given by the central dogma of molecular biology (Crick, 1970), namely, the DNA, mRNA and the protein level. Figure 1 shows the overview of Central Dogma. The central dogma of molecular biology describes the two-step process, transcription and translation by which the information in genes flows into proteins:
DNA - > RNA - >蛋白质
图像
在这项工作中,我们提出一个相关基因调控网络推理网络模型采用互信息来确定基因之间的相互作用。为此,我们提出一个互信息估计基于自适应分区,允许我们在离散和连续随机变量条件。我们提供了实验结果,证明该监管网络推理算法发现高度基因和基因预测乳腺癌和前列腺癌。结果验证了使用生物数据库。

二世。文献调查

入库单的重建或“反向工程”,旨在发现基因基因交互的底层网络的测量基因表达被认为是系统生物学中最重要的目标之一[2,3]。为此,逆向工程评估和方法的对话(梦想)计划成立鼓励研究人员开发新的高效的计算方法来推断健壮的入库单[4]。提出了不同的方法来推断从基因表达数据入库单(5、7),如离散的布尔网络模型和贝叶斯网络[8],微分方程(9 - 12),(13、14)和线性回归方法编程[15]。尽管许多流行的网络推理算法研究了[16,5],仍然有很大的空间电流模型改进了[20]。最近,越来越多的信息理论方法被用于重建入库单。几种基于互信息(MI)方法已经成功地应用于推断入库单,如ARACNE, CLR[23]和minet [21]。一般来说,这些方法首先计算两两之间的管理信息系统的所有可能的双基因,导致MI矩阵。MI矩阵然后操纵识别监管的关系。MI提供了一个相关的自然推广,因为它措施非线性依赖(这在生物学中很常见),因此吸引了太多的关注。这些方法的另一个优势是他们的能力来处理数以千计的变量(基因)的有限数量的样本。 Despite these advantages, MI- based methods only work when investigating pair-wise regulations in a GRN.

三世。缩写

背景:Deoxyribo核酸RNA:核糖核酸NCBI:国家生物技术信息中心地理:基因表达综合三里岛事故:阈值互信息微阵列:微小的DNA斑点附着在固体表面的集合。心肌梗死:互信息。入库单:基因调控网络。

四、数据集描述

t h e评估我们的方法的性能实验测试活性基质的乳腺癌和前列腺癌的数据集。完整的数据集可以下载从基因表达综合网站:http://www.ncbi.nlm.nih.gov/geo/GSE26910。数据集有54675个基因在24种不同实验条件下的信息。

诉的方法

这种方法中给出的算法是图2所示。
图像
答:预处理和标准化
数据集是相当大的54675个基因和大量的信息对应的基因,在实验中不显示任何有趣的变化。前置处理期间,基因不显示任何变化在实验中减少数据集的大小。如果我们通过基因列表,我们有几个点标记为“空”。这些是空点阵列,这些斑点噪声。函数isnan()是用来识别基因缺失的数据和索引命令用来消除基因缺失的数据。
b .过滤
应用t检验正常和肿瘤细胞之间的数据获取最重要的基因。未配对的研究数据和对平等和不平等的方差可以计算
图像
图像
d .的映射
前面步骤中获得的基因相互作用矩阵映射到基因的名字。
e基因调控网络
基因基因相互作用矩阵的结果导入到网络可视化和分析工具,Cytoscape。Cytoscape更强大的蛋白质与大型数据库一起使用时,protein-DNA和遗传交互越来越多地用于人类和生物模型。它允许网络的可视化集成表达谱,表型和其他分子状态信息和功能注释的网络数据库的链接。相互作用的基因选择获得的基因相互作用网络。这有助于我们轻松地识别程度最高的基因。这样的基因,称为高度相关的基因,据说有更高的影响导致癌症。
f .确定预后分子标记
高度相关的基因被用于预后分子标记的鉴定。这种分析使用。这种分析使用G2SBC (Genes-to-Systems乳腺癌数据库),G2SBC生物信息学资源收集和集成数据是关于基因。从这个分析发现基因GOLM1 CSMD2, MICAL2, TMEM167A, TBC1D2, POSTN, AEBP1, ZNF668, ZFAND3, TXNL1, VOPP1 TRIP13很常见,导致乳腺癌和前列腺癌[22]。

六。实验和结果

实验在乳腺癌和前列腺癌和54675个基因的活性基质下24个不同的实验条件。监管306基因相互作用网络图3所示。入库单30基因的统计分析如表1所示。
图像
图像
1。社区连接:节点的连通性是邻国的数量。的社区连接节点n的平均连接定义为n的所有邻居,图4。附近连接分配给所有节点的平均的社区连接n和k邻居k = 0, 1,…。
图像
2。亲密中心:这个节点的程度接近所有节点。图5显示了亲密中心策划对邻居的数量。它是计算英航s ed sh或t e t pa th年代,我t s g我n b y,
图像

七世。结论

在这工作,组成了一个新颖的方法,特性,即过滤功能、互信息和基因基因交互功能被用于癌症数据计算监管基因对之间的关系和重构网络的统计分析。这里的微阵列数据被认为是由54675个基因有12个乳腺癌和前列腺癌的每个数据集和12正常细胞中的每一个数据。我们的研究产量6主要结果;首先我们确定差异表达基因数据集,第二,已确定差异表达基因之间的相互作用;第三,基因调节其他基因被识别;第四,提供重建网络的统计分析显示大量的数据交互;第五,提供了高度连接10个不同的基因网络和第六,有助于确定预后分子标记的活性基质使用G2SBC乳腺癌和前列腺癌。从这个分析发现基因GOLM1 CSMD2, MICAL2, TMEM167A, TBC1D2, POSTN, AEBP1, ZNF668, ZFAND3, TXNL1, VOPP1 TRIP13很常见,导致乳腺癌和前列腺癌。结果提供了一个出色的相互作用机理的理解乳腺癌和前列腺癌的数据和生物医学世界提供了新的见解。
图像

引用

  1. 休斯,顶替et al .(2000)功能发现通过表达谱的纲要。细胞,102,109 - 126。
  2. 低音部,K。et al .(2005)在人类B cells.Nat逆向工程的监管网络。麝猫。,37, 382–390.
  3. Margolin,嗜et al。(2006)逆向工程蜂窝网络。Protoc Nat。,1663 - 672。
  4. 巴赫,d . et al。(2010)揭示基因网络推理方法的优点和缺点。Proc。《科学。美国,107年,6286 - 6291。
  5. 邦萨尔,M。et al .(2007)如何推断基因网络的表达谱。摩尔。系统。医学杂志。,3,78.
  6. 霍尔特,n。et al .(2001)基因表达数据的动态建模。Proc。国家的Acad.Sci。美国,98年,1693 - 1698。
  7. Tegner, J。et al .(2003)逆向工程基因网络:整合遗传学
  8. 考夫曼,S。et al .(2003)随机布尔网络模型和酵母转录网络。Proc。《科学。美国,100年,14796 - 14799。
  9. 改变,O。et al .(2000)奇异值分解的全基因组表达数据处理和建模。Proc。《科学。美国,97年,10101 - 10106。
  10. Cantone,我。et al .(2009)酵母体内合成网络评估的逆向工程和建模方法。细胞,137,172 - 181。
  11. di Bernardo, D。et al . (2005) Chemogenomic使用逆向工程基因网络分析在全基因组范围内。生物科技Nat。》。,Copyright to IJIRCCE www.ijircce.com 310 23, 377–383.
  12. Honkela,。et al .(2010)基于模型的方法,转录因子有限的目标识别数据。Proc。《科学。美国,107年,7793 - 7798。
  13. 加德纳,t。s。et al .(2003)推断基因网络通过表达分析和识别复合模式的行动。科学,301,102 - 105。
  14. Tibshirani, R。(1996)通过套索回归收缩和选择。j . r . Stat。Soc。B, 58岁,267 - 288。
  15. 王,Y。et al .(2006)从多个微阵列数据集推断基因调控网络。生物信息学,22岁,2413 - 2420。[16]阿尔泰,G。Emmert-Streib, F。(2010)揭示差异基因网络推理算法在网络层面的整体方法。生物信息学,26岁,1738 - 1744。
  16. 布鲁内尔,H。et al .(2010):小姐非线性方法基于互信息的遗传关联研究人口和sib-pairs分析。生物信息学,26岁,1811 - 1818
  17. 手中,进食Marchal, K。(2010)目前的网络推理方法的优点和局限性。启Microbiol Nat。,717 - 729。
  18. 迈耶,体育et al。(2008) minet: R / Bioconductor包推断大型转录网络使用互信息。BMC生物信息学,461。
  19. Margolin,嗜et al . (2006 b) ARACNE:一个算法的重建在哺乳动物细胞中基因调控网络。BMC生物信息学7 S7。
  20. Adamcsek B。et al。(2006) CFinder:定位派系和重叠的模块在生物网络。生物信息学,2006,22岁,1021 - 1023。
  21. 预后的分子特性的识别在人类乳腺癌和前列腺癌的活性基质安妮•Planche滨Bacac,病理学研究所CHUV,洛桑大学和学院生物学和医学