关键词:
牛
表观遗传
ATAC-seq
RNA-seq
摘要:
每个细胞的染色质DNA只有一部分表现出生物学活性,其染色质结构疏松,基因组DNA呈松散状态,该区域能够与转录元件结合,是染色质中基因表达活跃的部分,人们称之为染色质开放区域或者易接近染色质区域,剩下不活跃的部分则被紧密包装成高度凝聚的染色质而沉默下来。染色质的开放和关闭状态直接影响了包括基因表达、DNA复制和DNA修复在内的多种基本细胞过程。与此同时,染色质开放区域也是多种表观遗传修饰的共同结果,特别是与促进基因表达相关的表观遗传修饰的共同作用结果。克隆动物存活率低、发育异常,通常认为是表观修饰异常造成的。目前,克隆动物染色质开放区域差异性分析还没有任何相关研究,异常的表观修饰如何调控和影响克隆动物染色质状态也并不清楚。为了理解体细胞克隆牛染色质开放区域差异,我们选取外表健康存活的6头克隆牛耳组织样为研究对象,将其分成两组,其中3头(huiwa(HW),xingwa(XW),longwa(LW))克隆牛的供体核来源于胎儿成纤维细胞,另3头克隆牛(S1231,S1232,S1253)的供体核来源输卵管上皮细胞的体细胞,我们将这6种细胞的供体核进行ATAC-seq和RNA-seq分析。在ATAC-seq中,每头牛都获得19.5G clean bases以上的数据。进一步的数据分析发现40029条peaks的差异,其中18893条上调,21136条下调。根据这些数据进行peak注释,得到8653个基因中的3938个差异基因,将这些基因注释到染色体上,同时将基因进行通路分析,他们分布在317个通路上。在组蛋白甲基化过程中我们分析了KMT2、KMT5B、SUV39H1、SETDB、EZH和EED等相关基因的染色质开放情况。在DNA甲基化过程和去甲基化方面我们分析了APOBEC3Z1、TDE、SUMG1、DNMT1、DNMT3B和DNMT3A等基因的染色质开放情况。另外我们也分析了差异peak上存在的motif和差异motif。共预测到新的161个motif,并分析了这些motif在差异的19563个peak上的位置,其中有高表达的113个motif。在RNA-seq中,我们从基因和亚型两个方面统计基因表达水平的情况。我们发现1805个差异表达基因,而在不同基因亚型中存在7221个差异。我们在GO富集分析中发现差异基因在细胞进程、细胞、细胞部分和结合等过程中存在异常。我们着重分析了27个“生物学过程”、17个“细胞成分”和11个“分子功能”三个大类的差异聚类:在“细胞进程”通路中共有多达941个基因的差异;“细胞”通路和“细胞部分”通路中均有941个基因的差异;在“结合”通路中有784个基因差异。在亚型分析中,在“细胞进程”通路共有多达3804个基因的差异;“细胞”通路和“细胞部分”通路中均有3921个基因的差异;在“结合”通路中有3328个基因差异。此外我们挑选了富集最为显著的20条通路,绘制了差异表达基因KEGG富集散点。我们对KEGG富集的通路进行解析,统计差异表达基因,并将上调和下调基因注释到蛋白,在数据库中可以调取任意通路的差异基因,也可以直观的看到差异基因的变化。此外我们还分析并预测了可变剪切体、SNP/Indel和lnc RNA等。正常情况下,我们选取的同种克隆牛耳组织样品的ATAC和RNA虽有差别,但是不应该有明显的聚类倾向。我们分析却发现胎儿成纤维细胞和输卵管上皮细胞来源的耳组织有明显的聚类,而且ATAC-seq和RNA-seq分析结果较为一致,即3头胎儿成纤维细胞来源的耳组织样聚在一起,而另3头输卵管上皮细胞来源的耳组织样也聚在一起。这说明,虽然分析组织来源于相同部位的耳组织样,但是,由于它们的供体核细胞来源不同,而显出了染色质开放程度和基因表达差异。这一方面说明,不同来源的重编程体细胞的重编程表观修饰存在差异,即使是看似健康存活的克隆牛也不例外,更不用说克隆死亡和发育异常的克隆牛了。二阶聚类也说明,重编程的体细胞存在供体核细胞的影响记忆。