ISSN: 2320 - 0189
潘诺尼亚大学Georgikon系植物科学和生物技术系,H-8360 Keszthely, Deák Ferenc str. 16,匈牙利
收到了09/03/2016接受21/04/2016发表23/04/2016
更多相关文章请访问raybet36
从青蒿转录组数据集中鉴定了Amb a3亚型的完整编码序列和推测的信号肽。与已知的amba3变应原蛋白序列和硅致敏分析进行了比较。由于Amb a3仅通过氨基酸序列已知,本研究结果有助于探索Amb a3的遗传变异和表达特征,并为该花粉过敏原的免疫学研究提供参考。
豚草,豚草,过敏原,amba3,转录组。
豚草(特别美味的食物artemisiifoliaL.),原产于北美,是上世纪最成功的入侵植物物种之一[1]。在欧洲的一些地区,尤其是喀尔巴阡盆地,它是分布最广的杂草。2]。豚草花粉具有高度致敏性,在7月中旬至9月底的开花季节,越来越多的患者患有Ambrosia pollinosis(季节性变应性鼻炎)。在北美东部,豚草花粉占全年花粉捕获量的41% [3.]。一株植物平均产生约80亿粒花粉,空气中的花粉即使在遥远的地区也会危害健康[2,4]。考虑到豚草花粉过敏原的重要性,全面了解豚草花粉过敏原库是准确诊断和有效免疫治疗的先决条件[5]。
豚草的过敏原很小,分子量小于40kda的简单蛋白质。WHO/IUIS过敏原命名数据库将过敏原分类为10种答:artemisiifolia过敏原(6]。amba1和amba11分别被认为是主要过敏原,而其他是较小的蛋白质,根据它们在致敏作用中的重要性,它们被视为次要过敏原[7,8]。然而,对于几乎所有的Amb a过敏原和异构体(包括核酸和蛋白质序列),都是已知的,而血浆色素Amb a 3仅通过氨基酸序列已知[9]。近年来高通量分析技术的发展使大数据集的生成成为可能,促进了基因和同源序列的识别。在这项研究中,进行了基于从头转录组测序的分析,并确定了一种Amb (3-like protein)的假定编码序列。
植物材料
总共有6株豚草植物生长在一片耕地边缘的自然条件下(匈牙利Keszthely)。花分化前用透明纸袋包裹嫩枝,防止空气污染。RNA提取从复合花的原始期到成熟开花期的7个不同发育阶段对雄花进行采样,以尽可能多地鉴定花发育过程中表达的基因。
分子实验
RNA由RNAzol (Sigma-Aldrich, USA)根据生产商的建议进行提取。对于基于poly-A的mRNA富集和cDNA合成,根据制造商的说明使用Illumina TruSeqTM RNA样品制备试剂盒(低通量协议)。RNA-Seq使用Illumina HiSeq2000 (Illumina, USA)系统进行。每个片段对端测序100个核苷酸深。
高通量测序数据的从头组装和分析
转录组从头组装使用short-reads组装程序Trinity (http://trinityrnaseq.sourceforge.net/BETA/),将每个样本中重叠的100 bp长reads组合成contigs。对于组装转录组的注释,使用了Trinotate注释套装(http://trinityrnaseq.sourceforge.net/annotation/Trinotate。超文本标记语言)。
使用BLAST®命令行应用程序识别所调查基因的确切编码序列(http://www.ncbi.nlm.nih.gov/books/NBK279670/)。从Uniprot数据库中下载被测过敏原的蛋白序列。利用这些序列的蛋白质查询,将组装好的转录组作为数据库进行tBLASTn比对后,分析最佳的2-3个命中(e值截断值为1.0E-5)。显示contigs的最佳分数对齐和编码序列ORF的确定由genous®软件确定。
注释
序列注释使用UniProt Blast、对齐和注释函数完成。
信号肽分析
信号肽鉴定使用SignalP-4.1程序[10]。
序列变异分析
利用PROVEAN protein软件(http://provean.jcvi.org/)。[11]
变应原性预测
应用以下软件:
algpred -支持向量机(SVM),基于motif的MEME/MAST,过敏原代表蛋白(ARPs)片段和与已知IgE表位功能相同的片段已被使用[12]。
AllergenFP v.1.0-用于基于谷本系数的相似性最高的蛋白质的鉴定。AllerTOP v.2.0-用于测定最近的蛋白质[13,14]。
交叉反应性预测
过敏症猎人(http://tiger.dbs.nus.edu.sg/AllerHunter/index.html)软件用于预测与其他过敏原的交叉反应。
从转录组数据集来看,TR2040 contig与Amb a 3过敏原已知的101个氨基酸长序列在97%的序列覆盖率下显示出90%的相似性(图1),由2e-55 E-value支持。TR2040编码序列的翻译蛋白长107 aa,分子量12.02 kDA,其前面是一个长24个氨基酸的推测信号肽,其n端区域与Amb a 3蛋白相同。与Amb a3相比,TR2040蛋白c端有1个缺失,7个插入和6个氨基酸取代。两个序列的其他重叠部分是相同的。由于结构上的相似性,我们认为鉴定出的TR2040蛋白是Amb a 3的一种亚型,因此下文简称为Amb a 3-like。
在NCBI序列阅读档案(sequence Read Archive, SRA)中也鉴定了Amb a 3-like的396个核苷酸长编码序列。在LS454平台上对仙草花粉转录组ERR231631和ERR231632进行测序。在这些序列中发现了大量与Amb a 3-like氨基酸序列相同的reads,支持了我们实验中的组装是正确的[14]。
通过PROVEAN蛋白程序分析Amb a3与Amb a3相比氨基酸缺失、插入和替换的影响[11]。除了G100P取代被预测会产生有害影响外,W53缺失、插入(86F87和90FDHCQR91)和所有取代(R54K、D91G、C97N、P99T和R101S)被评估为对该蛋白功能具有中性影响。
Amb a3的序列注释表明,在61和88个氨基酸位置有一个二硫键,这意味着一个信号肽(见上文),在41和84个氨基酸位置有糖基化,还有一个Cys-97巯基被修饰,但不形成链间二硫键。除了C97N取代外,Amb a 3-like蛋白在这些位置上的氨基酸也是相同的,假设它们的功能相同。
AlgPred软件的致敏性预测分析在Amb a3和亚型中均未检测到经实验证实的IgE表位。然而,基于氨基酸和二肽组成的SVM分析预测该亚型是潜在的过敏原。ARPs数据库中的命中数也支持预测的致敏性。AllergenFP分析显示,与amba3样蛋白Tanimoto相似指数(0.88)最高的蛋白为amba3样蛋白,该异构体为可能的过敏原。通过AllerHunter软件进行交叉反应分析,预测两种蛋白与已知过敏原无交叉反应。
NCBI保守结构域分析表明,Amb a 3和Amb a 3-like均属于铜还蛋白超家族。在这两个蛋白中,假定的cu - binding -like (plasocyanin -like)结构域和phytocyanin结构域开始于相同的位置,但在Amb a 3-like中,这些结构域在c端比Amb a 3中更长(表1)。amba3的假定定义域在与amba3类比较的可变区域开始时结束。此外,在Amb中,除了最后一个氨基酸外,还获得了一个覆盖在蓝铜样蛋白结构域上的3-like非特异性命中,也获得了完整的c端(表1)。
域 | 加入 | Amb a 3 | Amb是3-like | ||||
---|---|---|---|---|---|---|---|
时间间隔 | 创造价值 | 打击 | 时间间隔 | 创造价值 | 打击 | ||
Cu_bind_like | pfam02298 | 14 - 91 aa | 8.29即使 | 具体的 | 14 - 98 aa | 3.36 e-35 | Non-sp。 |
Phytocyanin | cd04216 | 2 - 88 aa | 6.06 e-22 | Non-sp。 | 2 - 104 aa | 1.01 e-32 | 具体的 |
Blue_Cu_like | PLN03148 | - | - | - | 23 - 106 aa | 1.40 e-04 | Non-sp。 |
表1。保守域分析总结。
Amb a3亚型的完整编码序列是从一种Amb a3亚型的转录组数据集中鉴定的答:artemisiifolia。该编码序列长396个核苷酸,按氨基酸组成编码一个分子量为12 kDa的蛋白质。这比WHO/IUIS过敏原命名数据库中登记的11 kDa Amb a 3要大一些,后者的分子量是通过SDS-PAGE测定的。而Amb a 3-like比Amb a 3长6个氨基酸,在LS454平台上进行的SRA研究支持正确的组装[6]。454个reads被鉴定为与Amb A 3-like序列高度相似(>98%),其中许多翻译序列与Amb A 3-like相同[6]。Klapper等人认为,有证据表明在不同地理区域采集的花粉存在Ra3 (Amb a3)氨基酸序列差异[9]。因此,我们认为amba3样过敏原是amba3花粉过敏原的异构体。
用现有的软件进行了硅致敏性分析,并给出了需要实验证实的结果。
在不同的实验研究中发现了Amb a3的IgE反应性[15-18]。bordasfloch等人发现,Amb a3是18%豚草过敏患者的过敏原,这一数字高于其他已知的轻微短豚草过敏原,如Amb a4、5,6,9和10 [5]。然而,实验证实的Amb a3的IgE表位尚未确定,Atassi和Atassi在Amb a3中发现了具有相当大IgE结合能力的区域。利用15个氨基酸长重叠的合成Amb a3多肽,他们采用定量免疫吸附滴定法得出结论,Amb a3的1- 15,21 - 35,31 - 45,51 -65和71- 85aa区域具有相当大的(5.3-30.8%)IgE结合能力[16]。除了W53缺失和r54k替换外,amba3和amba3的其他区域是相同的。验证蛋白程序评估W53和r54k对蛋白功能的影响为中性。因此,可以假设,这两种蛋白质可能具有相同的IgE表位。
有趣的是,虽然最近的研究未能在转录组学和蛋白质组学分析中检测到Amb a 3过敏原,但他们发现了一个高度相似的分子,在氨基酸末端部分有96.7%的氨基酸序列相同,但c端不同。这些发现与我们的结果一致,并表明豚草过敏原中存在Amb a 3异构体[5,15]。
Amb a3被认为是一种质体青素,而且保守结构域分析对质体青素样结构域有特异性命中,而对植物青素结构域无特异性。质体青素是参与电子转移的含铜蛋白质。植物蓝素也参与电子转移反应,并被分类为植物蓝或I型含铜蛋白质。Amb a 3-like保守结构域分析表明,Amb a 3-like对植物青蛋白有特异性命中,对质体青蛋白样结构域无特异性,因此认为Amb a 3-like属于植物蓝铜蛋白。Amb a 3-like的临时蓝铜样蛋白的非特异性命中进一步支持了这一建议。
Amb 3的核苷酸序列尚未发表。在转录组中,amba3样蛋白与amba3蛋白最为相似。Amb a 3-like基因的克隆及在雄花不同发育阶段的表达分析正在进行中。重组蛋白可用于蛋白质组学和免疫学研究,并与amba3进行比较。因此,我们期望所鉴定的核苷酸序列将有助于进一步研究Amb a3及其同源基因的植物基因组和免疫学。
本研究由匈牙利科学院K100919 OTKA项目资助。