到达我们 + 1-845-458-6882
所有提交的EM系统将被重定向到网上投稿系统。作者被要求将文章直接提交给网上投稿系统各自的日志。

标题菊科植物叶绿体全基因组

应张1,关伟2,张晓楠1和李雷1

1热带动植物重点实验室“,生态海南师范大学生命科学学院,海南海口571158

2中国林业科学研究院热带森林研究所,广东广州510520

*通讯作者:
雷雳
海南师范大学生命科学学院,海南海口571158
电话:86 - 898 - 65883521
电子邮件:雷雳@126.com

收到日期:21/12/2015;接受日期:15/02/2016;发表日期:19/02/2016

更多相关文章请访问raybet36

摘要

迄今为止,在基因库中发现了27个菊科完整的叶绿体基因组。叶绿体基因组的高度保守性和缓慢的进化速度表明,它具有足够的一致性来进行不同物种的比较研究,但又有足够的差异性来捕捉进化事件,这使它成为分子系统发育和分子生态学研究的合适和宝贵的工具。本文综述了菊科27个完整叶绿体基因组的大小、基因组含量、LSC、SSC、IR- LSC/SSC边界、伪基因和DNA条形码等方面的研究。基于上述信息,各物种的完整叶绿体基因组为菊科植物提供了更准确的相互关系,可作为更合适的物种鉴定标记。

关键字

叶绿体基因组,菊科,假基因,DNA条形码,系统发育树。

介绍

菊科是一个复杂的物种,属于世界上第二大植物科,由170属2400种组成[1]。除南极洲外,菊科植物分布在各大洲。在菊科植物的研究中发现,在二级化学、花序形态和染色体数量上的表达差异极大[2]。此外,该家族还包括经济上重要的粮食作物、草本植物、切花业的观赏植物、具有经济和生态影响的杂草,以及一些入侵物种[3.-7]。

叶绿体起源于古代真细菌入侵[8],是具有自身遗传物质的多功能细胞器。它是植物细胞中必不可少的细胞器,在阳光照射下进行光合作用。叶绿体基因组高度保守的性质和缓慢的进化速度表明,它足够统一,可以在不同物种之间进行比较研究,但又有足够的分歧,可以捕捉进化事件,这使它成为分子系统发育和分子生态学研究的合适和宝贵的工具[7]。

自第一个cp基因组发表以来,完整的cp基因组的数量(http:// www.ncbi.nlm.nih。gov /基因组)由于高通量技术的发展,已迅速增加[3.6910]。目前,在Genebank细胞器基因组资源中保存的完整cp基因组有792个,而2014年为329个,2011年约为200个[67]。同时,从2012年开始,第一个完整的cp基因组摘要以属于菊科植物,迄今为止,在菊科植物基因库中还发现了26种其他植物。其中共发现12个亚科。青蜂花,青蜂花,青蜂花Cynara云淡的11属于Carduoideae;Leontopodium leiolepis属于Leontopodium;光argentatum属于光;Silybum marianum属于Silybum亚科;艾frigida艾蒙大拿属于艾;Aster spathulifoliusJacobaea寻常的属于Aster2-511-13]。矢车菊属diffusa矢车菊属物种;野菊花菊花Chysanthemum物种;Guizotia abyssinicaGuizotia植物;Heloanthus全cp基因组序列共发现8个亚科种:一年生向日葵,十瓣向日葵,横生向日葵,大山向日葵,多毛向日葵,马氏向日葵,巨纹向日葵和瘤纹向日葵51415]。外来入侵6),Ageratinn adenophora泽兰属植物亚科67]。本文描述了菊科cp基因组的大小、基因组含量、LSC、SSC、IR-LSC/SSC边界、伪基因和DNA条形码。基于上述信息,各物种的完整叶绿体基因组为菊科植物提供了更准确的相互关系,可作为更合适的物种鉴定标记。

大小和基因组含量

从所有已测序cp基因组的信息来看,大多数cp基因组的长度在120 ~ 160 kb之间,GC含量在30 ~ 40%之间[3.6]。菊科植物cp基因组为149.51 bp (As。spathulifolius)至153.202 bp (美国marianum)和长度略有不同(表1).与其他植物相比,这是菊科较大的cp基因组。多个完整的菊科cp基因组提供了在基因组水平上比较家族内序列变异的机会。用VISTA程序绘制了菊科所有27个cp基因组的序列身份,注释为答:adenophora作为参考(图1 a-1g),百分比标识图,总结于(表S1).基因组包括80多个蛋白质编码基因,从83 (Ch. indicum)到90 (c . diffusa)除了P. argentatum外,它的cp基因组在NCBI中只包含55个蛋白质编码基因注释,而在Kumar的论文中这个数字是85 [12]。rRNA的数量是7到9。rrn 23、rrn 16、rrn 5和rrn 4.5这4个基因是双基因,位于倒置重复序列(IRs)的两个拷贝中,在大多数物种中都可以找到[611]。不同之处在于苜蓿rrn 5缺失,向日葵亚科rps19在rRNA中有连接h .”。基因数量为106 (p . argentatum)至138 (h . annuus) [512]。对于tRNA,也有最少17英寸p . argentatum最大43英寸h . annuus表1).整个排列序列表明,菊科cp基因组相当保守,尽管在这些基因组之间发现了一些不同的区域。与其他被子植物相似,其编码区比非编码区更为保守。在所有的基因中,ycf1,ycf68和rps19基因的差异最大[3.7]。rpoC1基因含有两个与rpoC1相同的内含子答:adenophora也显示高序列发散[7]。此外,还发现一些地区表现出较高的分歧,包括的环境k-psbK aptL-aptF,的环境S -的环境G, ndhC -的环境M, psbL-petG rpl14-rpl16, and accD-psaI [6) (表S1).

botanical-sciences-Sequences-alignment

图1 a-1g。菊科27个cp基因组的序列比对。利用mVISTA程序对cp基因组序列进行比对。垂直刻度表示标识的百分比,范围从50%到100%。方法参照Zhang et al.[6]的研究。

LSC, SSC和IR-LSC/SSC边界

cp基因组形成双链环状分子,在大小、结构和基因含量上高度保守[7]。几乎所有cp基因组都共享四方组织,包括一个大单拷贝区域(LSC;80- 90kb)和小单拷贝区域(SSC;16-27 kb),以及两份20 - 28 kb大小的反向重复序列(IRs) [910]。被子植物cp基因组的基因含量和结构高度保守[1112]。在27个菊科物种,g . abyssinicacp基因组包含最大的LSCs之一。白花花有最小的LSCs和最大的ssc。那意味着frigida拥有最小的SSC区域(图2).IR的膨胀和收缩以及基因和内含子的损失在许多被子植物中都有记载[1314]。在陆生植物中,叶绿体基因顺序也是高度保守的,但在大多数情况下,当发生变化时,它们涉及一个或几个反转[16]。有几类陆地植物经历了大量的cpDNA重排,包括针叶树、被子植物科风铃科、豆科、天竺葵科和五莲科[1718]。菊科(Asteraceae)除Barnadesioideae的成员外,所有主要分支都有两个较大的约23kb和较小的约3.3 kb的cpDNA反转位点,这表明这两个反转位点可能是菊科(Asteraceae) cp基因组的关键未来[561218]。在菊科cp基因组中存在反转SSC的可能性仍有待证实,但鉴于反转重复序列的翻转机制的性质,不能排除这种可能性[19]。在那意味着frigida,与拟南芥等被子植物相比,SSC完全倒置[6]。然而,使用特定的引物来验证假设的反转事件将放大SSC,无论其方向如何[3.]。

botanical-sciences-border-position

图2。27个菊科cp基因组SSC、LSC和IR区边界位置的比较。基因组上方的方框表示了S所选基因或部分基因。方法参照Zhang et al.[6]的研究。

在cp基因组的两个SSC边界上,揭示了双子叶(即烟草、人参和烟草)的一般结构拟南芥),并包括ycf一个span和一个ycf1 IRb中毗邻JSB的假基因[20.]。基因的位置:石头剪刀19日,ycf1,ndhF,ycf1 *石头剪刀19 *除外的环境H是不保守的菊科cp基因组(图2).的ycf1个基因分布在SSC区或IRb/SSC区,但仅位于IRb区c . indicum。在基于“增大化现实”技术的蒙大拿。rps19*基因位于IRa区,其余基因位于LSC区作为。白花蛇舌草,白花蛇舌草,蛇舌草,白花蛇舌草l .漂白亚麻纤维卷。的ndhF距离IRa/SSC边界的距离不同,除IRa区域的十瓣草(H. decapetalus)和SSC区域外,其余菊科种均分布于SSC区域美国marianim在SSC/IRa边界。在这两个l .漂白亚麻纤维卷冷虫,ndhF位于IRb/SSC边界附近仅1 bp和75 bp,这两个物种都是入侵植物[6]。与其他单子叶和双子叶种相比,其位置的环境在cp基因组中,H基因是相当保守的。一般而言,的环境H基因在单子叶中位于IR区,而在双子叶中位于LSC区[2122]。所有菊科的双子叶属植物也是如此的环境H基因位于LSC区域[6]。

假基因

假基因是在细胞中失去基因表达或失去编码蛋白质能力的基因的无功能亲属[23]。假基因通常是由一个基因内的多个突变积累而成,其产物不是有机体生存所必需的。假基因的DNA虽然不编码蛋白质,但可能具有功能性,类似于其他种类的非编码DNA,具有调节作用[24]。在27种菊科植物中发现了22个cp基因组的伪基因(表1),在每个cp基因组中都可以找到不同的假基因。在c . cardunculus鉴定出三个假基因:ycf在IR中,68在其编码序列中包含一个过早的停止密码子;剩下的两个假基因,ycf1,石头剪刀19个,分别位于IRb/SSC和Ira/SSC的边界区域。它们蛋白质编码能力的缺失是由于部分基因重复[3.]。同样的三个假基因也可以在答:adenophora基于“增大化现实”技术。FrigidaPraxelis clematiea6713]。区别在于ycf在冷虫(Ar. frigida)中,IR中的68由于其编码序列中存在多个过早的终止密码子而成为假基因[25]。的三磷酸腺苷B基因与As编码基因的关系。spathulifolius [13],含有起始密码子,由于缺失而形成假基因。的三磷酸腺苷B基因与ATP合成酶有关,与ATP合成酶的关系更为密切加拿大皇家银行L基因的遗传结构。的三磷酸腺苷B基因常用于上层科水平的评价,也被认为有利于紫菀属及其近缘类群的系统发育研究[13]。但在作为。spathulifolius它没有在基因库中登记。在主要的入侵物种中,p . argentatum,发现了12个假基因:三磷酸腺苷F,ycf3.ycf4,石头剪刀12日,中电控股P,rpl16日,石头剪刀3.rpl2,石头剪刀12日,ycf1,ndh一个,ndhB (7]。然而,在向日葵种中,发现的假基因不超过两个ycf1,石头剪刀19日在h . annuusycf十瓣藻中有1个。的基因ycf1编码一种功能未知的必需蛋白,该蛋白似乎是一种多通道跨膜蛋白,与已知功能域无明显关联[526]。

物种 加入数量 大小(Kb) 蛋白质 核糖体rna tRNA 基因 假基因
摘要以 NC_007578.1 152.765 84 7 37 128 -
Partheniumargentatum NC_013553.1 152.803 55 8 17 106 16
野菊花 NC_020320.1 150.972 83 8 34 125 -
Praxelisclematidea NC_023833.1 151.41 84 8 32 131 7
菊花 NC_020092.1 151.033 85 8 35 128 -
向日葵竹 NC_023107.1 151.066 85 8 36 131 2
Leontopodiumleiolepis NC_027835.1 151.072 85 8 37 132 2
向日葵 NC_007977.1 151.104 85 8 43 138 2
Guizotiaabyssinica NC_010601.1 151.762 85 8 37 132 2
Ageratinaadenophora NC_015621.1 150.698 86 8 37 136 5
艾蒙大拿 NC_025910.1 151.13 86 8 37 133 2
Cynaracardunculus KM035764 152.529 86 8 37 131 6
Aster spathulifolius NC_027434.1 149.51 87 8 37 132 -
Jacobaea寻常的 NC_015543.1 150.689 87 8 37 132 -
艾frigida NC_020607.1 151.076 87 8 37 134 2
Cynarabaetica NC_028005.1 152.548 87 8 37 136 4
Cynaracornigera NC_028006.1 152.55 87 8 37 136 4
Cynarahumilis NC_027113.1 152.585 87 8 36 135 4
Silybummarianum NC_028027.1 153.202 87 8 37 136 4
Centaureadiffusa NC_024286.1 152.559 90 8 36 135 1
向日葵maximiliani NC_023114.1 151.007 85 9 36 131 1
向日葵grosseserratus NC_023108.1 151.017 85 9 36 131 1
向日葵strumosus NC_023113.1 151.044 85 9 36 131 1
向日葵羊角拗 NC_023109.1 151.045 85 9 36 131 1
向日葵hirsutus NC_023111.1 151.045 85 9 36 131 1
向日葵Helianthus tuberosus NC_023112.1 151.047 85 9 36 131 1
向日葵decapetalus NC_023110.1 151.048 85 9 36 131 1

表1。27个菊科cp基因组的大小和基因。

DNA条形码

一些研究基于cp序列分析了菊科的系统发育关系。其中最全面的分析包括108个分类群[27]。但到目前为止,还没有发现某种特殊基因或组合基因可以在种及种以下水平上作为适用于所有菊科植物的DNA条形码。对于Asteraceae,ycf1和ndhF基因最初处于低谷,逐渐解体后出现亏损[1213]。已知该区域有助于分析属间进化。的ycf1基因也被发现是所有基因中最具差异性的A.adenophoraP.argentatum18]。所以ycf1基因可能是最适合进行系统发育分析的基因,尽管它对一些菊科物种没有影响。用matK基因分析了8种菊科对帕thenium与Lactuca亚科的差异无作用[20.]。即使它能提供足够的信息来区分三个帕thenium种,matKbarcode也不能进行区分p . argrntatump . argentatump . agentatum彼此的台词[12]。使用组合条形码,如matK和公安局A -的环境H,在某些物种水平及以下的额外分化[12]。基因ndhF和的环境L-F也被选作菊科90种的系统发育分析[25]。在菊科植物系统发育研究中发现了其他DNA条形码,如的环境日本须贺-的环境fMCAU和的环境SGCU -的环境CGCA rps32 -的环境L和公安局A-trnH等更多基因在表223.7132829]。在图3,组合ndh用C、ndhA和ndhG对菊科27种进行了分析向日葵,两英寸菊花Cynara亚科中的4个可聚为一组,在种水平上可进行分化。然而,它也分开了两个泽兰属植物物种分为两组。在Curci的研究中,整个cp序列比使用Cynara的一个可变性状子集提供了更高的系统发育分辨率[11]。随着越来越多的cp基因组在Genebank中注册,随着Asteraceae家族测序成本的降低,整个cp基因组的功效可能是一个超级条形码。

列1 列2
系统发育树的DNA条形码
库马尔等人[12] matK, psbA-trnH,组合matK和psbA-trnH
加西亚等人,[28] trnSUGA-trnfMCAU, trnSGCU-trnCGCA
Doorduin等[2] ndhC-trnV, ndhC-atpE, rps18-rp120,clpP, psbM-trnD, petN-psbM, rps8-rps14, ycf1, ycf3-trnS, ndhA, petD,petB, ndhl, rps8-rps3, rps15, rpoC1, psbB, rpoC2, nshG, rpoB, cemA, psaC,组合区域
聂等[7] atpA, atpB, matK, petA, petB, petD, petG, petN, psaA, psaB, psbA, psbB, psbC, psbD, psbE,psbF, psbH, psbI, psbJ, psbK, psbN, psbT, rpoB, rpoC1, rpoC2,rps8, rps11, rps14, ycf3, ndhA, ndhD, dhH, ndhF, rpoA
Riggins等[29] rps32-trnL, psbA-trnH
刘等[25]. ndhF, trnL-F
张等[6]. ccsA-trnL, trnG-trnfM, rpl33-rps18, lhbA-trnG,rpoC2-rps2,cemA- peta,ndhG- ndhe,psbK-psb1,rpl16-rps3,clpP,matK,ycf3,rps15,psbH,psbI,rbcL,ycf4,ndhK,atpF,rpl20,ndhI,rps8,rpoA,infA,cemA,rps14,ndhG,ndhH,组合区域
崔等[13] accD, atpB, atpE, cemA, clpP, infA,matK, ndhC, ndhJ, ndhK, petA, petB, petD, petG, petL, psaA, psaB, psaI, psaJ,psbA, psbB, psbC, psbD, psbF, psbH, psbI, psbK, psbL, psbN, psbT, psbZ, rbcL,rpl14, rpl16, rpl20, ps22, rpl23, rpl33, rpl36, rpoA, rps3, rps4, rps8, rps11,rps14, rps16, rps18, rps19和ycf2
Curci等[3] matK,ndhD,ndhF,ndhl,rncL,rpoB和rpoC1的第一外显子

表2。采用DNA条形码技术对菊科植物进行了系统发育树分析。

botanical-sciences-maximum-parsimony

图3。菊科27种植物ndhC、ndhA和ndhG组合的最大简约树。方法参照Zhang et al.[6]的研究。

视角

利用Genebank中已发现的27个菊科全cp基因组信息,我们可以得到以下结论:从cp基因组的大小来看,这些是菊科相对于其他植物的较大cp基因组。菊科cp基因组是一个双链环状分子,在大小、结构和基因含量上与其他植物一样高度保守。假基因在大多数菊科植物中都有发现,而且基因的使用不方便。对于DNA条形码来说,在种及种以下水平上,仍然没有一些特殊的基因或组合基因可以作为适合的DNA条形码来区分所有菊科植物。但是,随着越来越多的cp基因组被登记到基因库,随着Asteraceae家族测序成本的降低,整个cp基因组的功效可能是一个超级条形码。

确认

本研究获得国家自然科学基金(No. 31360173)资助。

参考文献

全球科技峰会