E- issn: 2320 - 3528
P- issn: 2347 - 2286
Atala Bihari Jena1沙桑克·塞卡尔·斯温2*
1部门生物信息学,耶什旺特IT学院,印度马哈拉施特拉邦佩尔巴尼-431401
2部门生物信息学, BJB (A)学院,布巴内斯瓦尔,印度奥里萨邦-751014
收到日期:10/07/2013;接受日期:26/09/2013
更多相关文章请访问rayapp
随着生物医学人类科学领域的研究发现,人体中的几种蛋白质对健康有害。原癌基因c-Rel蛋白主要存在于人体内,由REL基因编码,属于REL /NF- kB转录因子家族,调节多种细胞功能。原癌基因参与细胞分化和淋巴细胞生成并发挥重要作用。原癌基因突变时可能有害并引起癌症。要了解人原癌基因c-Rel蛋白的作用机制,必须了解该蛋白的结构模型,但其三维结构尚未在蛋白质数据库(protein Data Bank, PDB)中报道。本研究对智人原癌基因c-Rel进行了完整的结构分析和三维建模。在PDB Blast报告的基础上,利用SWISS MODEL对原癌基因rel蛋白的三维结构进行了预测。利用save (PROCHEK、VERIFY 3D、ERRAT)和Ramachandran Server对预测模型进行了评价,结果表明,预测值均为可接受值,最终精化模型可靠性较好。总体结果为模型质量良好提供了证据,为实验衍生晶体结构的功能分析提供了充分的基础,也有助于癌症研究,为原癌基因c-Rel蛋白基于结构的药物设计提供了新的起点。
原癌基因c-Rel, BLASTp, SWISS MODEL, Ramachandran plot, VERIFY-3D, ERRAT。
核因子κB (NF-κB)是一种主要的先天性调节因子免疫反应[1]。的re are five member of the mammalian NF- κB family like p65 (RelA), RelB, c-Rel, p50/p105 (NF- κB1) & p52/p100 (NF- κB2)[2-4]. The proto-oncogene c-Rel is a protein that in humans is encoded by the REL gene [5, 6]. The c-Rel protein is a member of the NF- kB transcription factor family [7] and Rel-related proteins share a conserved 300-aminoacid amino-terminal domain Rel homology domain (RHD) at its N-terminus that encompasses to c-Rel for play an important role in B-cell survival and proliferation. TheREL该基因在几种人类b细胞淋巴瘤中扩增或突变,包括弥漫性大b细胞淋巴瘤和霍奇金淋巴瘤淋巴瘤[8]。转录因子核因子(NF)-κB被认为是淋巴结和Peyer's patch发育的关键中介因子。NF-kappa-B是一种多效转录因子,几乎存在于所有类型的细胞中,并参与许多生物过程,如炎症,免疫力分化,细胞生长[10].c-Rel最初被认为是v-Rel的细胞同源物和禽Rev-T的致癌基因逆转录酶病毒结果显示,[11].c- rel与无所不在转录因子NF- κB的NFKB1 (pS0)和relA (p65)亚基高度同源。NF- κB结合在病毒和细胞基因的启动子和增强子中发现的十聚体基序(κB元件),主要是编码免疫、急性期和炎症反应相关蛋白质的基因[12-15]。
二聚Rel/NF- κB蛋白在脊椎动物中由一个小的多基因家族编码。这些基因包括nfkbl(pS0和p105),nfkb2(p52和pl00), rela (p65), relb (relb), c-re/ (Rel)和v-rel。两个与rels相关的同源物,背而且dif已经在果蝇中被发现。背是一种转录调节因子,在胚胎发生过程中决定细胞沿背腹轴的发育命运[16],而dif是免疫功能[17]所必需的。每两个男性中就有一个,每三个女性中就有一个会在一生中患上癌症。Rel经常与其他相关蛋白(NF- κB, I-kappa B, relA)结合形成调节转录的异源二聚体。c-rel重排或过表达可引起肿瘤发生[19]。的current list of known cancer genes includes 70 genes associated with germ line mutations and 342 genes associated with somatic mutations. In fact, a recent high-throughput study of proto-oncogene突变在代表17种不同类型癌症的1000个不同肿瘤样本中,一组14个原癌基因的突变与高癌症倾向有关。此外,本研究还发现这14个原癌基因与多种细胞功能[20]相关。癌细胞不受控制地生长和分裂并逃脱细胞死亡,而原癌基因主要参与这一过程。原癌基因是一组基因,当正常细胞发生突变时,会导致细胞癌变[21,22]。肿瘤坏死因子(Tumor Necrosis Factor, TNF)-α是肿瘤和浸润炎性细胞中表达的一种细胞毒性细胞因子。许多癌症[23]的微环境,包括头颈部鳞状细胞癌[24]。有趣的是,HNSCC对TNF-α介导的生长阻滞和凋亡具有矛盾的抗性,这种抗性涉及NF-κB/REL转录因子[25]的异常激活。不受控制地生长和分裂变成癌症原癌基因揭示了正常细胞过程如何突变的一些线索,即原癌基因是如何一步一步地流向致癌基因到巨蟹座[26,27]。
目前,已知40多种不同的人类原癌基因,以及将这些原癌基因转化为癌基因的突变。致癌基因是原癌基因表达水平或活性增加的突变的结果。与癌基因激活相关的潜在遗传机制包括在原癌基因启动子区域的点突变、缺失或插入导致过度活跃的基因产物之后,导致转录增加的基因扩增事件导致原癌基因的额外染色体副本。染色体易位事件,原癌基因重新定位到一个新的染色体位点,导致更高的表达。导致原癌基因和第二基因融合的染色体易位,产生具有致癌活性的融合蛋白。癌基因的分子机制尚不清楚。但在过去的20年里,我们对癌症发病机制的理解取得了巨大的进展,很明显,癌症的发生是通过一个多诱变步骤过程,并获得了一系列共同的特性,包括不受限制的增殖潜力,生长信号的自给自足,以及对抗增殖和凋亡线索的抵抗。现在研究人员发现20%的激酶通路在肿瘤发生中起积极作用。主要目标是建立一个参考该序列的计算三维结构,这可能在提高致癌基因或癌症的效率方面发挥重要作用,并可能通过结构证据来了解致癌基因的途径以及如何抑制它们(in-silico).此外,还可以通过同源建模对该结构进行修改和验证。可以通过服务器和工具来鉴定受体附着的各种活性位点,这可能导致鉴定蛋白质的最便携位点。Ramachandran图显示了对psi和phi角具有有利构像的残基,这将有助于进一步了解氨基酸在蛋白质结构中的稳定性和旋转,并在比较建模中发挥重要的桥梁作用,该蛋白的活性位点或可药物位点(结构证据)可能有助于开辟具有正药物效率的疾病控制新方向。
目标选择
人原癌基因c-Rel蛋白的氨基酸序列智人从UniProtKB (Acc。不。: Q04864)数据库(http://www.uniprot.org /help/ uniprotkb)。
序列分析和蛋白失序预测
在检索该序列后,用ProtParam[29]对其理化性质进行预测。ProtParam计算了分子量、理论pI、氨基酸组成、消光系数、不稳定性指数、脂肪族指数和亲水性总平均(GRAVY)。蛋白紊乱用DisEMBL[30]进行预测。这是一个巨大的挑战蛋白质组学结构基因组学时代是预测蛋白质的结构和功能,包括识别那些部分或全部非结构的蛋白质。DisEMBL是一种用于预测蛋白质序列中无序/非结构化区域的计算工具。
模板的选择
从Uniprot KB (Acc。号:Q04864)。对Brook Heaven Protein Data Bank (PDB)进行BLASTp[31]默认参数搜索,以寻找合适的模板进行同源建模。一组PDB结构1gji A、1NFI A、1IKN A、2I9T A和1RAM A与目标序列具有很好的相似性。基于高阳性和低间隙率(%)的最大同一性,选择c-Rel binding to DNA晶体结构(1GJI_A)作为模板。模板与目标之间的查询覆盖率、序列识别率、阳性率和间隙率分别为44%、84%、93%和0%。
三维结构预测与验证
本研究考虑了毛皮蛋白的二级结构特征,采用了一种新的高精度二级结构预测方法SOPMA视图[32],SOPMA结合了两个前馈神经网络,对从spi -BLAST (position specific Iterated BLAST)[33]获得的输出进行分析,并使用SWISS MODEL (comparative protein 3D modeling server)构建了人类原癌基因c-Rel蛋白的三维结构[34,35,36,37,38]。
三维结构预测模型通过VERIFY 3[39]和SAVES服务器(http://nihserver.mbi.ucla.edu/SAVES)进行评估。用PyMOL软件[40]建立可视化蛋白模型。蛋白质模型的结构验证采用Rampage[41]进行,通过综合分析确定立体化学方面以及主链和侧链参数。人原癌基因c-Rel蛋白的Ramachandran图显示,在允许区、有利区和区域有不同的残基。最后,对模型质量进行了检验,并对模型的原生蛋白质折叠能进行了评估程序ProQ[42]和ProSA[43]分别进行了输出和候选模型的选择,筛选出了最可靠和最优秀的模型。
在获得人原癌基因c-Rel蛋白序列后,用ProtParam预测其理化性质。预测该蛋白序列为619个氨基酸,分子量为68519.6道尔顿,等电点为5.58,等电点低于7表示蛋白质带负电,不稳定性指数为39.24,脂肪族指数为66.91。积极的肉汁指数-0.562表明亲水和可溶性蛋白质。使用DisEMBL服务器预测蛋白质序列中的蛋白质紊乱或无序/非结构化区域,结果如下所示(图1)
二级及三级结构
蛋白质的二级结构是由氢键稳定的有规律重复的局部结构。最常见的例子是alpha-helix和beta-sheet。在人类原癌基因c-Rel蛋白结构的不同位置,SOPMA视图显示有92个螺旋(14.86%),122个链(19.71%),378个线圈(61.07%)和27个beta弯(4.36%)人类智人(图2).
三级结构
选择合适的模板(1GJI a)后,利用SWISS model (comparative protein 3D modeling server)构建目标蛋白模型。预测模型采用PyMol可视化软件进行可视化。人原癌基因Rel蛋白的三维结构如下(图3).
模型有效性
通过不同的方法评估了模型蛋白和模板蛋白的几何和结构一致性。结构验证采用著名的蛋白质结构检测程序SAVES server进行。Ramachandran图的Φ和Ψ分布。分析结果显示,在人原癌基因c-Rel蛋白的Ramachandran图中,只有一个残基(0.0%)属于不允许区。总的来说,这两个同源物在立体化学允许的主链原子中的分布几乎相同(87.4%)(视图).
此外,利用另外两个蛋白质评价程序(Verify3D和ERRAT)来检查我们的模型的立体化学。Verify3D (图5)对模型中氨基酸序列与氨基酸侧链环境的相容性进行评分(100%)。根据溶剂可及性和极性原子覆盖侧链的比例来评价侧链的环境。ERRAT评估蛋白质模型中不同类型原子的排列。这是一种敏感的技术,有利于识别蛋白质初步模型中错误折叠的区域。
ERRAT图(图7).这表明所构建的人原癌基因c-Rel蛋白结构是可以接受的。(综合质量因子75.75%)。
利用ProQ软件对模型结构进行了质量检验。结果表明,预测LG评分5.510(> 4为极好模型)和预测MaxSub评分0.343(>0.5为良模型)均在良模型的可接受范围内。
通过ProSA -Web能量图计算各残基的相互作用能和Z-score [图7]。采用基于距离的对势法计算了各残基的ProSA相互作用能。在本研究中,建模的蛋白质显示了具有正相互作用能的最大残基,符合模型的可靠性。模型的总体z评分为-6.68 kcalmol-1,它与模板1GJI_A非常相似。的results obtained from ProSA suggest that the generated HUMAN Proto-oncogene c-Rel protein structure was energetically consistent compared to the template structure.
本研究的主要目的是对人原癌基因c-Rel蛋白进行序列分析、结构分析和同源性建模。的in-silico方法通过给他们一个现成的想法来帮助研究人员,这样他们就可以愉快地朝着疾病的治疗前进,并有助于最大限度地减少两者之间的差距在网上湿实验室用于蛋白质的三维结构测定。研究还旨在证明没有无法治愈的疾病,只是治疗方法可能以其他形式隐藏着。同时,本工作旨在突出生物信息学在我国的应用药物设计.人类原癌基因c-Rel蛋白的三维结构模型稳定可靠,使用SAVES服务器和Rampage & VERIFY3D模块。最大的氨基酸落在α-螺旋区域,这提供了蛋白质的稳定性。ProSA、ProQ的总体结果表明,预测的人原癌基因c-Rel蛋白的三维结构是可接受的、质量良好的,预测人原癌基因c-Rel蛋白的结构可以了解其活性位点和活性位点残基,可以利用软件进一步分析其活性位点残基,从而制备配体和受体,为癌症研究提供了一个新的基于结构的起点药物原癌基因c-Rel蛋白设计。
感谢研发中心、高科医学院和医院课题组对我们的大力鼓励和支持。我们非常感谢布巴内斯瓦尔BJB (A)学院的教职员工在准备手稿时给予的帮助和鼓励。