所有提交的EM系统将被重定向到网上投稿系统.作者被要求将文章直接提交给网上投稿系统各自的日志。

用Chirp z变换法测定蛋白质的特征频率

Anjali沙玛1, Rameshwar Singh2
  1. 系学生电气工程,印度瓜廖尔
  2. 系助理教授电气工程,印度瓜廖尔
有关文章载于Pubmed谷歌学者

更多相关文章请访问国际电气、电子和仪器工程高级研究杂志

摘要

蛋白质通过与其他被称为目标的分子相互作用来发挥作用。蛋白质-靶标相互作用在本质上是非常特定的,发生在蛋白质中预先定义的位置,称为热点。为了成功的蛋白质-靶标相互作用,蛋白质和靶标必须共享称为特征频率的共同频谱成分。特征频率是蛋白质-靶标相互作用的基础,因此本文介绍了一种利用啁啾z变换确定蛋白质特征频率的方法。

关键字

蛋白质、特征频率、啁啾z变换、共识谱、电子-离子相互作用电位(EIIP)、共振识别模型(RRM)

我的介绍。

蛋白质可能是最重要的一类生化分子。蛋白质是构成动物和人类组织主要结构成分的基础。蛋白质是生命的基石,是细胞生长和组织修复所必需的。蛋白质是由氨基酸组成的天然高分子分子。所有的蛋白质都是由20种叫做氨基酸的化合物组成的。蛋白质分子依靠氨基酸连接在一起,形成酶、激素、肌肉、器官和身体的许多组织。
蛋白质是氨基酸通过肽键连接在一起的聚合物。有20种不同的氨基酸基本上构成了地球上所有的蛋白质。氨基酸由一个羧酸基、一个氨基和一个可变侧链组成,它们都连接在中心碳原子(也称为α碳)上。侧链是氨基酸之间唯一不同的组成部分。因此,区分一种氨基酸与另一种氨基酸的特征是其独特的侧链,它决定了氨基酸的化学性质[1]。
生物学家把蛋白质[2]的结构分为四个层次。一级结构是蛋白质中氨基酸的线性排列和共价键的位置,如氨基酸之间的二硫键。二级结构由蛋白质内的折叠或卷曲区域组成,例如α螺旋和折叠片,它们由氢键稳定。蛋白质最后的三维结构是由氨基酸之间大量的非共价相互作用产生的。四元结构来自于非共价相互作用,将多个多肽结合成一个更大的蛋白质。尽管蛋白质可以想象为氨基酸的线性链,但实际上它们并不是线性链。它们折叠成复杂的三维(3-D)结构,在自身原子之间形成弱的非共价键。正是这种折叠能力使它们能够执行极端的特定功能。指定蛋白质三维形状所必需的信息包含在其氨基酸序列中。[2]

2线性调频z变换

啁啾Z变换算法是数字信号处理领域中最常用的算法之一。啁啾Z变换是一种对N个样本的Z变换进行数值计算的计算算法。该算法被命名为chirp Z-transform (CZT)算法。利用CZT算法可以有效地求出Z平面上M个点的Z变换,这些点位于Z平面上任意点开始的圆形或螺旋计数器上。点的角间距为任意常数,M和N为任意整数。
该评价基于圆螺旋轮廓上的Z变换值可以表示为离散卷积。
图像

3共振识别模型

蛋白质通过与其他被称为目标的分子相互作用来执行其生物学功能。这些相互作用本质上是非常有选择性的。这种相互作用的特异性在于蛋白质分子独特的三维结构。这些位置被称为活跃区。为了使蛋白质-靶相互作用成功,蛋白质和靶必须具有相同的特征频率而具有相反的相位。这对应于蛋白质分子能量分布周期性的峰值必须与目标分子能量分布周期性的相应低谷相匹配,反之亦然。这种能量分布周期性的匹配类似于共振,因此特征频率被称为共振识别模型(RRM)[4]。基于共振识别模型,我们可以通过检测蛋白质和目标分子是否具有共同的特征频率来预测特定蛋白质是否会与任意目标分子相互作用。

四、电子-离子相互作用势

蛋白质由20种氨基酸组成,每种氨基酸用不同的字母表示,因此蛋白质可以用一个字符序列来表示。为了将数字信号处理(DSP)应用于蛋白质,需要将蛋白质的特征序列映射到数值序列上。数值的选择是基于氨基酸的一些物理性质,这些性质与氨基酸的生物学功能有关。为氨基酸分配数值的成功尝试是[12],其中每个氨基酸都分配了一个称为其电子-离子相互作用势(EIIP)的数值。氨基酸的电子-离子相互作用势是表示氨基酸中价电子平均能量的物理性质,与蛋白质的生物学性质密切相关
图像
表1列出了20种不同氨基酸的EIIP值。因此,按顺序排列的每一个氨基酸都可以用一个唯一的数字表示。现在可以将数字信号处理算法或工具应用于得到的数值级数。

五、特征频率的确定

此前已成功尝试使用离散傅里叶变换(DFT)[4-7]和功率谱密度(PSD)[8-10]确定特征频率;在这里,我们提出了一个类似的方法使用啁啾z变换。
确定特征频率的第一步是选择感兴趣的蛋白质官能团。一个功能群中的蛋白质数量可能因情况而异,假设我们在一个功能群中有M个蛋白质序列。首先计算所有M个蛋白质的啁啾z变换,然后将它们相乘,就可以确定一个功能群的共同特征频率,从而得到一个功能群的一致频谱。群体的共识频谱在特征频率处有一个峰值。一个典型的共识谱所需的蛋白质序列M的数量因情况而异。应使用足够数量的蛋白质序列,以在共识频谱的特征频率上实现明显的峰值。最初可以尝试一组两种蛋白质序列。如果存在模糊性(共识谱中有几个相似的峰),则可以将感兴趣功能群中的一个或多个蛋白质序列纳入共识谱的计算。

六、举例说明

为了证明所提出的方法的威力,我们展示了三个不同的例子。我们选择了以下蛋白质序列[13-14]:
细胞色素C蛋白。
(2)溶菌酶蛋白
细胞色素C是一种小的血红素蛋白,与线粒体的内膜松散相连。细胞色素C主要被称为携带电子的线粒体蛋白。细胞色素C在细胞内的亚铁态和铁态之间的转变使其成为一种高效的生物电子转运体,在植物和动物的细胞氧化中起着重要作用。它通常被认为是呼吸作用的通用催化剂,在可呼吸物质和氧气之间形成必要的电子桥梁。
溶菌酶,动物泪腺分泌物、鼻粘液、胃分泌物和蛋清中发现的酶。1921年由塞拉·亚历山大·弗莱明发现,溶菌酶催化某些细菌细胞壁中某些碳水化合物的分解。绞痛)。
细胞色素C有4个蛋白序列,溶菌酶有5个蛋白序列。有关蛋白质例子的初步细节见表2。

7结果与讨论

对于每个例子,特征频率是从与感兴趣的蛋白质序列属于相同功能群的足够大的蛋白质序列集的共识频谱中确定的。用于确定特征频率的蛋白质序列数量如表2所示。
A.金枪鱼细胞色素
图1(a)显示了通过将细胞色素C金枪鱼心脏蛋白的每个氨基酸替换为其EIIP值而获得的相应数值序列的图形表示。图1(b)显示了细胞色素C金枪鱼心脏蛋白的啁啾z变换。由于有许多峰值,因此不可能清楚地确定特征频率。
图1(c)显示了利用chirp z变换方法(CZT)获得的细胞色素c官能团共识谱。不同的峰值对应于特征频率。
图像
图像
图像
用chirp z变换分析细胞色素C的共识谱。不同的峰值对应于特征频率。
图像
B.母鸡蛋清溶菌酶
图2(a)显示了用母鸡蛋清溶菌酶的每个氨基酸的EIIP值替换得到的相应数值序列的图形表示。
图2(b)显示了母鸡蛋清溶菌酶的啁啾z变换。由于有许多峰值,因此不可能清楚地确定特征频率。
图2(c)是利用chirp z变换得到的溶菌酶官能团共识谱。不同的峰值对应于特征频率。
图像
图像
图像

8结论

提出了一种利用啁啾z变换确定特征频率的方法。生物学相关蛋白序列在特征频率上存在一个显著的峰,该峰可以由来自同一官能团的多个蛋白序列从一致性谱中得到。峰值与特征频率相对应,具有相同生物学功能的一组蛋白质序列仅存在一个峰值。

参考文献

  1. B. Alberts, D. Bray, A. Johnson, J. Lewis, M. Raff, K. Roberts, P.Walter, Essential Cell Biology, Garland Publishing, New York, 1998。
  2. 戴霍夫,《蛋白质序列与结构图谱》,第5版。华盛顿:生物科学。1978年决议基金,增编。3.页345 - 352。
  3. A. A. Bogan和K. S. Thorn,“蛋白质界面的热点解剖”,分子生物学杂志,vol. 280, pp. 1- 9,1998。
  4. I. Cosic,“大分子生物活性:是大分子之间的共振相互作用吗?”-理论和应用,“IEEE Trans。生物医学工程师,第41卷,no。12,第1101-1114页,1994年12月。
  5. P. Ramachandran, A. Antoniou,和P. P. Vaidyanathan,“利用短时间离散傅里叶变换识别和定位蛋白质中的热点”,第38届Asilomar会议,信号,系统,计算机,太平洋格罗夫,CA, 2004年11月,第1656-1660页。
  6. P. Ramachandran和A. Antoniou,“使用数字滤波器识别和定位蛋白质中的热点”,IEEE信号处理选定主题杂志。第二卷第三期,2008年6月。
  7. p。p。Vaidyanathan和b。j。Yoon,“基因组学和蛋白质组学中信号处理概念的作用”,富兰克林研究所杂志,卷。341, pp. 111-135, 2004。
  8. Yashpal Yadav和Sulochana Wadhwani,“确定蛋白质中热点的特征频率”,国际电气电子工程杂志,第1卷,第1期,2011。
  9. Yashpal Yadav和Sulochana Wadhwani,“利用功率谱密度识别蛋白质的特征频率”,国际电子工程进展,第1卷,第1期,2011,pp. 342-346。
  10. Yashpal Yadav和Sulochana Wadhwani,“利用功率谱密度识别蛋白质的特征频率”,国际先进计算,通信和网络会议论文集,第1095-1099页,[在线],在昌迪加尔,2011年6月2-3日。
  11. 斯托伊卡,P.和R.L.摩西,光谱分析导论,普伦蒂斯-霍尔,1997年,第24-26页。
  12. K. D. RAO和M. N.S . Swamy,基于DSP技术的基因组和蛋白质组学分析,电子工程学报,Vol. 55, No. 1, 2008年2月。
  13. 瑞士蛋白知识库。瑞士生物信息学研究所(SIB).[在线]。可用:http://us.expasy.org/sprot/。
  14. 蛋白质数据库(PDB),结构生物信息学研究合作实验室(RCSB)。(在线)。可用:http://www.rcsb.org/pdb/。
全球科技峰会