关键词:
肠道菌群
微生物互作
特征菌种
张量分解
摘要:
人体胃肠道中分布着数量众多的微生物,它们包含有约100倍于人类自身的基因数目的基因,涉及营养代谢、外源物和药物代谢、抗菌、免疫调节、胃肠屏障维稳和修复等多种功能,这使其与宿主疾病健康状态密切相关。肠道菌群的功能行使,与肠道菌群内和菌种与宿主间的互作密不可分,因此,研究肠道微生物菌种间、肠道菌群与宿主间潜在相互作用,对解析相互作用机制,确定疾病与菌群因果关联,寻找相关疾病临床干预治疗的靶点具有重要意义。肠道菌群具有响应外部扰动而连续变化的特点,这暗示了以往横断面研究的分析方法在肠道菌群微生物组研究中的局限性,在分析时需要考虑菌群时间动态的研究方法。以往的菌群时间动态分析主要使用现有生态学模型解释体外合成菌群或宿主内菌群的时间动态,但模型与分析方法效用有限,因此,需要一种兼顾微生物时序样本、实验队列设计、微生物多样性三个方面的分析方法。张量分解是矩阵分解的高阶泛化,它将具有微生物多样性特征、实验队列设计和时序样本三个指标的微生物组丰度张量分解为具有多个潜在因子的微生物多样性特征、实验队列和时序样本的因子矩阵,其中,潜在因子可以看作描述变化的功能单位,从而在分析中兼顾微生物时序样本、实验队列设计、微生物多样性三个方面。本研究尝试将张量分解方法应用于微生物组16S rDNA时间序列数据,以挖掘可能存在潜在互作关系的菌种。具体结果如下:1)在根据简化的细胞生长的离散时间马尔可夫模型(Discrete-time Markov model of cell growth)生成的模拟数据集上测试了几种张量分解方法,成功解析了设计的6个操作分类单元(OTU,operational taxonomic unit)间的相互作用,同时将模拟数据集划分为训练集和测试集,比较张量分解方法和广义洛特卡-沃尔泰拉(gLV)模型从训练集还原测试集的能力,结果显示了非负限制张量分解方法能更好捕获设计的操作分类单元间互作关系(P-value=0.0196)。2)使用12株人体肠道菌群常见菌株体外合成菌群测试张量分解,其结果可以部分解释12株菌株体外两两培养关系的互作网络,同时比较了基于原始数据和分解后的因子矩阵计算的菌群结构的距离,二者显示出一致性,表明张量分解方法可以捕获体外真实数据中的潜在结构。3)收集了志愿者粪便样品,并对小鼠进行粪菌移植,将非负限制的张量分解方法应用于粪菌移植前后小鼠肠道菌群16S rDNA测序数据,并基于分解结果在差异倍数阈值为2、P值为0.05下进行差异分析,找了可能具有相关性的潜在因子与可能具有互作关系特征菌种,且这些菌种间潜在互作关系得到先前研究的支持。根据这些结果,我们得出结论:非负限制的张量分解能够在分析中兼顾微生物时序样本、实验队列设计、微生物多样性三个方面的信息,这有助于从肠道菌群数据中有效的确定可能存在互作关系的菌种,有助于后续验证实验的设计和互作功能机制的研究,从而实现复杂菌群结构的简化,并为从头构建合成菌群提供技术基础。同时,本研究基于现有算法和软件实现了一个从16S rDNA测序原始数据到获得具有潜在互作菌种的方法流程。