关键词:
石斛属
叶绿体基因组
系统发育
药用植物
鉴定
摘要:
石斛属Dendrobium Sw.植物是重要的药用类群,全球约1500种,主要分布于亚洲热带、亚热带地区及大洋洲。自1799年Swartz建立石斛属以来,该属分类受到多次修订,属内分组及物种的划分长期存在争议,分类鉴定困难,容易造成石斛类药材的应用混乱,严重影响临床用药的安全和有效。此外,由于药用、食用和观赏价值的多重需求,石斛属植物资源遭到了毁灭性破坏,多个物种被列为濒危等级,同时尚缺乏部分物种的遗传信息,限制了石斛属资源的保护与开发利用,制约了相关医药产业的可持续发展。鉴于此,本研究对70种石斛属植物的叶绿体基因组进行测序、组装和注释,其中25个物种为首次测序;采用比较基因组学的分析方法,深入剖析了不同物种间的叶绿体基因组特征,并基于叶绿体全基因组和蛋白编码序列(Coding sequence,CDS)构建系统发育树,探讨石斛属的分类和种间亲缘关系;此外,通过分子钟方法估算了石斛属的分化时间,并选取茎形态、叶片质地、花色和叶鞘是否被黑毛的形态特征进行祖先性状重建;最后,采用内转录间隔区(Internal transcribed spacer,ITS)对石斛属药用植物进行鉴定,主要结果如下:
(1)石斛属植物叶绿体基因组具典型的四分体结构(大单拷贝(Large single-copy,LSC)、小单拷贝(Small single-copy,SSC)和2个反向重复(Inverted repeats,IR)区),总长度为146,397 bp~163,367 bp,最大相差16,970 bp,其长度差异主要来自LSC和SSC区域。70个石斛属物种叶绿体基因组平均总GC含量为37.3%,各区域序列中GC含量从高到低依次为IRs>LSC>SSC。此外,共注释到110~134个基因,其中蛋白编码基因为64~88个,核糖体核糖核酸基因为8~10个,转运核糖核酸(Transfer ribonucleic acid,t RNA)基因为35~38个,注释到的基因类型基本相似,但基因数目在不同物种间存在一定差异。属内基因缺失现象较为普遍,尤其是ycf和ndh类基因以及ch IB、ch IL基因在大部分石斛属物种中存在缺失;t RNA基因仅在竹枝石斛***(Blume)Lindl.(trn E-UUC、trn Y-GUA)和龙石斛*** Rchb.f.(trn G-GCC)发生丢失。这些基因丢失事件可能与石斛属植物的适应性进化有关。
(2)简单重复序列(Simple sequence repeat,SSR)结果显示,70种石斛属植物叶绿体基因组共检测到2859个SSR位点,以A/T基序为主的单核苷酸基序占比最多,具有明显的AT偏向性,该现象与AT和GC的解链难易程度以及序列的变异程度有关。密码子偏好性分析结果表明,石斛属植物的密码子使用偏好性较弱,且偏好使用A/U结尾的同义密码子,高AT含量是同义密码子以A/U结尾的主要原因。
(3)石斛属叶绿体基因组IRb-SSC和IRa-SSC边界较IRb-LSC和IRa-LSC边界存在更大的变异,大部分石斛属植物的IR区经历了收缩和扩张,该现象与ndh F和ycf1基因的缺失具有相关性。序列变异比较分析发现,石斛属叶绿体基因组LSC区、SSC区的变异明显大于IR区,非编码区的变异程度高于蛋白编码区,基因间隔区的进化速率快于基因编码区。
(4)基于叶绿体基因组和CDS序列的系统发育结果与传统形态分类学存在一定差异,本研究结果支持:i.将瘦轴组***并入石斛组***中,而非保持单独的分类;ii.建议将部分寡花组***物种,包括勐腊石斛*** ***&*** Hook.f.、曲轴石斛*** Lindl.、疏花石斛*** Schltr.和罗河石斛*** Tang&***以及顶叶组***的长苏石斛*** Rchb.f.归于石斛组中;iii.支持将小黄花石斛*** Lindl.和聚石斛*** Steud.从顶叶组中独立出来另立新组;iv.原归于圆柱叶组***的海南石斛*** Rolfe与剑叶组***的物种聚为一支,建议将其并入剑叶组中;v.顶叶组的鼓槌石斛*** Lindl.、叉唇组***的叉唇石斛*** Lindl.、石斛组的王氏石斛*** ***,***&***以及本研究首次测序的双槽