关键词:
第四纪冰期
走出青藏高原
冰清绢蝶
比较基因组学
群体遗传学
转座子
局部环境适应
摘要:
全球环境变迁与物种演化是当前进化生物学关注的一个热点问题。尤其是在第四纪冰期气候变化驱动下,众多生物类群走出青藏高原,并扩散至亚洲、欧洲及北美洲等地,对整个北半球生物多样性的形成产生了重要影响。然而,这些高山类群“走出青藏高原”及其局部环境适应的进化基因组学机制则知之甚少。
绢蝶属(Parnassius)是一类隶属于鳞翅目凤蝶科的典型高原蝶类,同时也是基因组最大的蝶类类群。早期关于绢蝶起源与演化的相关研究表明,它们是在新生代早中新世(距今21~17百万年前)青藏高原造山运动这一复杂的地质环境演变背景下形成并快速辐射至北半球的典型昆虫类群之一。在漫长的进化过程中,绢蝶不仅保留了分布在青藏高原的众多高海拔土著物种,同时还存在少数扩散至欧洲、北美洲以及东亚(主要中国中东部)的中、低海拔物种。特别是冰清绢蝶(Parnassius glacialis),以前研究表明它是唯一经过中国西北、华中和华东等温带地区并在第四纪冰期时扩散至长江以南的绢蝶物种,为我们探讨“走出青藏高原”昆虫类群的基因组进化与群体演化提供了理想的研究对象。
本研究主要以一个较低海拔分布的绢蝶物种(冰清绢蝶)为研究对象,通过Denovo基因组测序以及9个不同海拔群体(300~1800 m)的重测序,利用比较基因组与群体遗传学等方法,分析了冰清绢蝶的庞大基因组形成、基因家族扩张、群体遗传结构、种群历史动态以及选择性清除模式,并着重探讨了转座子(Transposable element,TE)在基因组组成、基因重复、群体遗传分化以及选择性进化中的关键作用,为第四纪冰期高山类群“走出青藏高原”的进化适应提供新的见解。本研究的主要结果如下:
1.中国10种不同海拔绢蝶物种的基因组大小评估
本研究基于基因组Survey测序,评估了不同海拔分布(300~5000 m)的中国10种代表性绢蝶属物种的基因组大小。结果发现,绢蝶的基因组大小主要介于1.00~1.90 Gb之间,并且与海拔分布有一定关系。其中,分布在青藏高原高海拔地区(主要在3000~5000 m左右)的蓝精灵绢蝶(***)、安度绢蝶(***)、西猴绢蝶(***)、君主绢蝶(***)与珍珠绢蝶(***)的基因组大小约为1.0~1.22 Gb,而“走出青藏高原”的中、低海拔分布(主要在300~3000m左右)的小红珠绢蝶(***)、白绢蝶(***)、阿波罗绢蝶(***)、羲和绢蝶(***)与冰清绢蝶(***)的基因组大小普遍介于1.27~1.90 Gb之间。总之,与青藏高原土著绢蝶相比,“走出青藏高原”的绢蝶物种普遍拥有更大的基因组。
2.冰清绢蝶的基因组组装及其基因组大小形成机制
本研究基于Pac Bio测序以及Hi-C测序,完成了冰清绢蝶的染色体水平基因组组装与注释。基因组组装结果显示,冰清绢蝶基因组约为1.35 Gb,主要由29条染色体组成,其Contig N50长度为6.45 Mb,Scaffold N50长度为49 Mb,BUSCO完整性达到了95.8%。基因注释结果显示,冰清绢蝶中共鉴定到17,080个蛋白编码基因,平均转录本长度约为21.08 kb,平均内含子长度为4.52 kb,平均外显子数量为5.37个。与近缘凤蝶属蝶类相比,冰清绢蝶基因有着更长的转录本、更长的内含子以及较少的外显子数量。重复序列注释结果显示,冰清绢蝶基因组中大约含有971 Mb的重复序列(占71.8%),是已知重复序列占比最高的蝶类物种之一。其中,LINE、DNA、LTR、SINE和Helitron转座子在冰清绢蝶基因组中分别约占38.9%、10.64%、6.28%、3.40%和4.38%左右。
结合已公开的珍珠绢蝶(3000~5000 m)和阿波罗绢蝶(800~3000 m)基因组,本研究进一步分析了3种绢蝶中转座子的Kimura分布以及插入时间,并评估了LTR反转座子的不等重组率(Solo-LTRs/complete LTRs)。结果发现,转座子活动在3种绢蝶中的爆发时间主要集中在第四纪(约3 Ma以内)。尤为注意的是,此次转座子爆发事件主要涉及少数几种类型的转座子,包括LINE/RTE、LINE/CR1、LTR/Gypsy和LTR/Pao等。由此推测第四纪冰期与间冰期旋回气候变化可能激发了转座子的爆发,使得绢蝶属成为基因组最大的蝶类类群。同时,“走出青藏高原”的冰清绢蝶和阿波罗绢蝶的LTR反转座子不等重组率分别为1.15和0.08,远远小于分布在青藏高原高海拔地区的珍珠绢蝶2.67。这表明高海拔分布的珍珠绢蝶通过较高转座子不等重组率在一定程度上抑制了基因组的增加,而中、低海拔分布的冰清