到达我们 + 1-845-458-6882
所有提交的电磁系统将被重定向到在线手稿提交系统。作者请直接提交文章在线手稿提交系统各自的杂志。

菊科的完整叶绿体基因组物种

应张1,关2,Xiaonan张1和雷雳1*

1重点实验室的热带动植物生态海南,海南师范大学生命科学学院,海南,海口,571158年中国

2热带森林研究机构,CAF, 510520年广州,中国

*通讯作者:
雷雳
海南师范大学生命科学学院571158年海口,海南,中国
电话:86 - 898 - 65883521
电子邮件:雷雳@126.com

收到日期:21/12/2015;接受日期:15/02/2016;发表日期:19/02/2016

访问更多的相关文章raybet36

文摘

直到现在,27菊科完整叶绿体基因组基因发生了银行。高度保守的性质和缓慢的叶绿体基因组进化速率足够证明这是统一进行比较研究不同物种但发散充分捕捉进化事件,这使得它一个合适的和无价的工具或者分子系统学和分子生态学研究。基因组研究大小,内容,LSC, SSC, IR - LSC / SSC边界,假基因和DNA条形码菊科这些27完整的叶绿体基因组的研究进行了综述。基于上述信息,每个物种的完整叶绿体基因组菊科中提供了一个更精确的关系,可以作为一个更合适的物种识别的标志。

关键字

叶绿体基因组,菊科,伪基因DNA条形码,系统发育树。

介绍

家庭菊科是一个复杂的物种属于第二大的家庭组成的世界上的植物,2400种分布在170属(1]。除了南极洲,菊科是分布在各大洲。非常不同的表达式在二级化学、花序形态和染色体数目的研究中发现了菊科植物(2]。此外,这个家庭的成员包括经济上重要的粮食作物,草本物种,花卉行业的观赏植物,杂草丛生的经济和生态的影响和一些外来物种(3- - - - - -7]。

叶绿体(cp),源自古老的真细菌入侵(8),是多功能细胞器拥有自身的遗传物质。植物细胞的重要细胞器,它在阳光下进行光合作用。高度保守的性质和缓慢的叶绿体基因组进化速率足够证明这是统一进行比较研究不同物种但发散充分捕捉进化事件,这使得它一个合适的和无价的工具或分子系统学和分子生态学研究7]。

出版以来第一个cp基因,可用完整的cp基因的数量(http:// www.ncbi.nlm.nih。gov /基因组)迅速增长得益于高通量技术的发展(3,6,9,10]。今天,有792个完成存入的cp基因资源库细胞器基因组资源,而在2014年329年和200年的2011 (6,7]。与此同时,从2012年第一个完整的cp基因摘要以属于家庭菊科发表,直到现在,其他26个菊科植物资源库中报道。其中,12个亚科被发现。,西娜拉cornigera,西娜拉cardunculus Cynara naeticaCynara云淡的(11)属于Carduoideae;Leontopodium leiolepis属于Leontopodium;光argentatum属于光;Silybum marianum属于Silybum亚科;艾frigida艾蒙大拿属于艾;Aster spathulifoliusJacobaea寻常的属于Aster(2- - - - - -5,11- - - - - -13]。矢车菊属diffusa矢车菊属物种;野菊花菊花x栽培Chysanthemum物种;Guizotia abyssinicaGuizotia植物;Heloanthus亚科有8种被发现整个cp基因序列:向日葵,向日葵,向日葵decaetalus羊角拗,向日葵grosseserratus,向日葵hirsutus,向日葵masimiliani,向日葵strumosus和向日葵tuberisus(5,14,15]。外来入侵(6),Ageratinn adenophora泽兰属植物亚科(6,7]。在本文中,我们描述的大小,基因组内容,LSC, SSC, IR-LSC / SSC边界,假基因和DNA条形码的菊科cp基因。基于上述信息,每个物种的完整叶绿体基因组菊科中提供了一个更精确的关系,可以作为一个更合适的物种识别的标志。

基因组大小和内容

从所有cp基因组测序的信息,大多数他们范围从120到160 kb的长度和GC含量30 - 40%3,6]。cp的基因组从149.51个基点(菊科物种。spathulifolius)到153.202个基点(美国marianum)和长度略有不同(表1)。这些是大的cp菊科的基因组与其它植物。多个完整的菊科cp基因可以提供一个机会来比较序列变异genomelevel在家庭中。所有27菊科cp基因的序列的身份使用VISTA绘制程序的注释答:adenophora作为参考(图1 a-1g),身份情节概括百分比(表S1)。基因组包含超过八十个蛋白-编码基因从83年(Ch. indicum)到90 (c . diffusa),除了一个物种:p . argentatum cp基因只包含55 proteins-coding在NCBI基因注释,但Kumar的论文[的号码是8512]。核糖体rna的数量从7到9。rrn rrn四个基因:rrn 23日16日5和4.5 rrn双定位两个副本的反向重复(IRs)可以在多数物种(6,11]。消失的差异是rrn 5 l和加入的rps19 rRNA马唐向日葵亚科除外h .”。基因的数量从106年(p . argentatum)到138 (h . annuus)[5,12]。tRNA,至少也有17个p . argentatum和最大43h . annuus(表1)。整个一致表明,菊科cp基因序列是相当保守的,虽然这些基因组之间的一些不同地区被发现。类似于其他被子植物,编码区比非编码更加保守。所有的基因,ycf1,ycf68和rps19基因是最不同的3,7]。rpoC1基因同样包含两个内含子答:adenophora也显示了很高的序列差异(7]。此外,许多地区被发现显示散度高,包括的环境k-psbK aptL-aptF,的环境S -的环境G, ndhC -的环境米,psbL-petG rpl14-rpl16, accD-psaI [6)(表S1)。

botanical-sciences-Sequences-alignment

图1 a-1g。27菊科cp基因序列的联合。cp基因序列一致,而使用mVISTA程序。垂直刻度显示身份,比例从50%到100%不等。方法根据研究Zhang et al。[6]。

LSC, SSC和IR-LSC / SSC边界

cp基因形成双链,环状分子,在大小、高度保守的基因结构和内容(7]。由四部分组成的组织被几乎所有的cp基因共享,large-single-copy组成的区域(LSC;80 - 90 kb)和small-single-copy区域(SSC);16-27 kb),以及两份反向重复(IRs) ~ 20到28 kb大小的9,10]。被子植物的基因内容和结构cp基因是高度保守的11,12]。在27个菊科物种,g . abyssinicacp基因包含最大的lsc之一。c . diffusa lsc最小和最大的细胞。那意味着frigida有最小的SSC区域(图2)。扩张和收缩的红外以及基因和基因内区损失已经记录在一个广泛的被子植物(13,14]。叶绿体基因顺序也是高度保守的陆地植物中,但在大多数情况下,当变化发生时,它们涉及一个或几个反演[16]。有几个的陆地植物组经历了大量的cpDNA重组,包括裸子植物,被子植物的家庭桔梗科,豆科,牛儿苗科Lobeliaceae [17,18]。的两个cpDNA反演大约23 kb和小约3.3 kb是菊科的共享的所有主要的演化支,除了Barnadesioideae成员,表明这两种反演可能是一个关键的未来菊科cp基因(5,6,12,18]。可能存在反向SSC的菊科cp基因仍然是符合但不能排除反向重复的触发器机制的性质(19]。在那意味着frigida,一个完全反转SSC观察与其他被子植物物种相比,如拟南芥(6]。然而,特定的引物被用来验证假定反转事件将放大SSC无论其方向(3]。

botanical-sciences-border-position

图2。SSC的边界位置的比较,LSC 27菊科cp基因和红外区域。年代当选基因或部分基因是由上方的框表示基因组。方法根据研究Zhang et al。[6]。

在cp基因的两个SSC边界,总体结构显示在双子叶植物(即。、烟草、人参拟南芥),包括ycf1跨ycf1 peseudogene毗邻JSB在IRb [20.]。基因的位置:石头剪刀19日,ycf1,ndhF,ycf1 *石头剪刀19 *除外的环境H是菊科un-conservative cp基因(图2)。的ycf1基因分布或IRb / SSC SSC地区地区,但是只有位于IRb地区c . indicum。在基于“增大化现实”技术的蒙大拿。rps19 *基因在爱尔兰共和军地区,但其他人LSC地区除了正在消失作为。spathulifolius, c . diffusa Ch. indicum Ch. x morilolium, j .寻常的l .漂白亚麻纤维卷。的ndhF不同距离爱尔兰共和军/ SSC边境,和完全位于SSC地区菊科物种除了h . decapetalus IRa地区美国marianimSSC /爱尔兰共和军边界。在这两个l .漂白亚麻纤维卷那意味着frigida, ndhF 1 bp和75 bp IRb / SSC边界附近,和两个物种都是入侵植物(6]。与其他单子叶植物和双子叶植物物种相比,的位置的环境H基因在cp基因组中相当保守。一般来说,的环境H基因位于红外区域在单子叶植物中,相比之下,它的位置在双子叶植物(LSC地区21,22]。与双子叶植物相同,在所有菊科的种类,的环境H基因位于LSC地区(6]。

假基因

假基因functionless亲属的基因失去了基因表达在细胞或其编码蛋白质的能力(23]。假基因往往源于基因内多个突变的积累,其产品不需要生存的有机体。虽然不编码蛋白质,伪基因的DNA可能功能,类似于其他类型的非编码DNA可以起到监管作用[24]。22 cp基因被发现假基因在27菊科植物(表1),可以发现不同的假基因在每个cp基因。在c . cardunculus三个假基因被确定:ycf68年,红外,包含一个过早的终止密码子编码序列;剩下的两个假基因,ycf1,石头剪刀19日,位于之间的边界地区IRb / SSC和Ira / SSC,分别。蛋白质编码能力的缺乏是由于部分基因重复(3]。相同的三个假基因也可以找到答:adenophora,基于“增大化现实”技术。FrigidaPraxelis clematiea(6,7,13]。不同的是ycf68年红外成为假基因由于几个过早停止密码子存在于其编码序列在那意味着frigida [25]。的三磷酸腺苷B基因与编码基因。spathulifolius [13),包含一个密码子开始,形成了一个假基因由于删除。的三磷酸腺苷B ATP合酶相关基因,更密切相关加拿大皇家银行L基因的遗传结构。的三磷酸腺苷B基因常被用于评价上家族的水平,这也被认为是有利于属的系统发育研究Aster和密切相关的组织(13]。但在作为。spathulifolius这不是注册在资源库中。在一个主要的入侵物种,p . argentatum十二个伪基因被发现:三磷酸腺苷F,ycf3,ycf4,石头剪刀12日,中电控股P,rpl16日,石头剪刀3,rpl2,石头剪刀12日,ycf1,ndh一个,ndhB (7]。然而,在向日葵物种,不超过两个伪基因被发现ycf1,石头剪刀19日在h . annuusycf在h . decapetalus 1。的基因ycf1编码一个蛋白质的未知函数至关重要,这似乎是一个多路转移膜蛋白质,没有明确协会已知功能域(5,26]。

物种 加入数量 大小(Kb) 蛋白质 核糖体rna tRNA 基因 假基因
摘要以 NC_007578.1 152.765 84年 7 37 128年 - - - - - -
Partheniumargentatum NC_013553.1 152.803 55 8 17 106年 16
野菊花 NC_020320.1 150.972 83年 8 34 125年 - - - - - -
Praxelisclematidea NC_023833.1 151.41 84年 8 32 131年 7
菊花x栽培 NC_020092.1 151.033 85年 8 35 128年 - - - - - -
向日葵竹 NC_023107.1 151.066 85年 8 36 131年 2
Leontopodiumleiolepis NC_027835.1 151.072 85年 8 37 132年 2
向日葵 NC_007977.1 151.104 85年 8 43 138年 2
Guizotiaabyssinica NC_010601.1 151.762 85年 8 37 132年 2
Ageratinaadenophora NC_015621.1 150.698 86年 8 37 136年 5
艾蒙大拿 NC_025910.1 151.13 86年 8 37 133年 2
Cynaracardunculus KM035764 152.529 86年 8 37 131年 6
Aster spathulifolius NC_027434.1 149.51 87年 8 37 132年 - - - - - -
Jacobaea寻常的 NC_015543.1 150.689 87年 8 37 132年 - - - - - -
艾frigida NC_020607.1 151.076 87年 8 37 134年 2
Cynarabaetica NC_028005.1 152.548 87年 8 37 136年 4
Cynaracornigera NC_028006.1 152.55 87年 8 37 136年 4
Cynarahumilis NC_027113.1 152.585 87年 8 36 135年 4
Silybummarianum NC_028027.1 153.202 87年 8 37 136年 4
Centaureadiffusa NC_024286.1 152.559 90年 8 36 135年 1
向日葵maximiliani NC_023114.1 151.007 85年 9 36 131年 1
向日葵grosseserratus NC_023108.1 151.017 85年 9 36 131年 1
向日葵strumosus NC_023113.1 151.044 85年 9 36 131年 1
向日葵羊角拗 NC_023109.1 151.045 85年 9 36 131年 1
向日葵hirsutus NC_023111.1 151.045 85年 9 36 131年 1
向日葵Helianthus tuberosus NC_023112.1 151.047 85年 9 36 131年 1
向日葵decapetalus NC_023110.1 151.048 85年 9 36 131年 1

表1。大小和27菊科cp基因组的基因。

DNA条形码

几项研究已经分析了系统发育关系在菊科家庭基于cp基因序列。最全面的分析包括108类群之一(27]。但直到现在,还没有一些特殊的基因或基因组合可以区分所有菊科植物的合适的DNA条形码下面的物种水平。菊科,ycf1和ndhF基因存在的最初和最终触底后损失逐渐瓦解(12,13]。这个区域是已知有助于分析国际米兰——属进化。的ycf1基因也被发现是最不同的基因A.adenophoraP.argentatum(18]。所以ycf1基因可能是最好的适合基因的系统发育分析,尽管它是某些种类的菊科没有影响。matK基因被用来分析八菊科不同物种,它没有使用光与以亚科(20.]。即使它能够提供足够的信息来区分三个光物种,matKbarcode没有区分p . argrntatump . argentatump . agentatum线从对方12]。使用合并后的条形码,如matK和公安局A -的环境H,以下额外的一些物种的分化水平和(12]。基因ndhF和的环境l f也选择的系统发育分析的90种菊科家庭(25]。其他DNA条形码等紫菀科的系统发育研究中被发现的环境日本须贺-的环境fMCAU和的环境SGCU -的环境CGCA rps32 -的环境L和公安局A-trnH和其他更多的基因所示表2(2,3,7,13,28,29日]。在图3的组合ndhC, ndhA和ndhG被用来分析27种菊科,七个物种向日葵,两个在菊花和四个Cynara亚科可以集中在一组,在物种分化水平。然而,它也两个分开泽兰属植物物种两组。在库尔奇的研究,整个cp序列提供了系统分辨率高于在Cynara[使用可变字符的一个子集11]。注册与越来越多的cp基因资源库,整个的功效cp基因可能是一个特别条码和测序成本的减少的菊科家庭。

列1 列2
DNA条形码系统树
Kumar et al。[12] matK、psbA-trnH matK看似松散,psbA-trnH
加西亚等。[28] trnSUGA-trnfMCAU, trnSGCU-trnCGCA
Doorduin等。[2] ndhC-trnV、ndhC-atpE rps18-rp120、clpP psbM-trnD, petN-psbM, rps8-rps14, ycf1, ycf3-trnS, ndhA, petD, petB, ndhl, rps8-rps3, rps15, rpoC1, psbB, rpoC2, nshG, rpoB cemA psaC,结合区域
聂等。[7] atpA、atpB matK,善待动物组织、petB petD, petG,以季戊四醇四硝酸酯psaA, psaB, psbA, psbB, psbC, psbD, psbE, psbF, psbH, psbI, psbJ, psbK, psbN, psbT, rpoB, rpoC1, rpoC2, rps8, rps11, rps14, ycf3, ndhA, ndhD, dhH, ndhF rpoA
里等。[29] rps32-trnL, psbA-trnH
刘et al。[25] ndhF, trnL-F
Zhang et al。[6] ccsA-trnL、trnG-trnfM rpl33-rps18、lhbA-trnG rpoC2-rps2, cemA-petA, ndhG-ndhE, psbK-psb1, rpl16-rps3, clpP, matK, ycf3, rps15, psbH, psbI, rbcL, ycf4, ndhK, atpF, rpl20, ndhI, rps8, rpoA, infA, cemA, rps14 ndhG ndhH,结合区域
崔等。[13] accD、atpB atpE, cemA、clpP infA, matK, ndhC, ndhJ, ndhK,善待动物组织,petB, petD, petG, petL, psaA, psaB, psaI, psaJ, psbA, psbB, psbC, psbD, psbF, psbH, psbI, psbK, psbL, psbN, psbT, psbZ, rbcL, rpl14, rpl16, rpl20, pl22, rpl23, rpl33, rpl36, rpoA, rps3, rps4, rps8, rps11, rps14, rps16, rps18, rps19 ycf2
库尔奇等。[3] matK、ndhD ndhF, ndhl、rncL rpoB rpoC1第一外显子

表2。DNA条形码是用来在菊科物种系统发育树。

botanical-sciences-maximum-parsimony

图3。的最大吝啬树ndhC、ndhA和ndhG 27菊科的种类。方法根据研究Zhang et al。[6]。

视角

27菊科整个cp基因的发现信息资源库,我们可以得到以下结论:从cp基因组的大小,这是更大的cp基因与其他植物相比菊科。菊科cp基因组形成双链,环状分子,在大小、高度保守的基因结构和内容和其他植物一样。伪基因都可以在菊科物种和基因是不方便。DNA条形码,还有没有一些特殊的基因或基因组合可以区分所有菊科植物的合适的DNA条形码下面的物种水平。但是,越来越多的cp基因在基因注册银行,整个的功效cp基因可能是一个特别条码和测序成本的减少的菊科家庭。

确认

这项工作是支持中国国家科学基金会(31360173)。

引用

全球技术峰会