关键词:
机器学习
大数据
动物遗传育种
遗传改良
摘要:
随着智慧畜牧研究的深入和高通量组学平台的发展,动物育种逐渐进入大数据时代的“育种3.0”,而机器学习是大数据研究不可或缺的有效手段。机器学习亦称计算机自动获取知识,是一门多领域交叉学科,涉及概率论、统计学等多门学科,作为人工智能和数据挖掘中的热门算法之一,具有学习能力强、准确率高和泛化能力强等优势,已经成为生物信息分析领域处理大型数据和进行预测的重要工具。目前广泛用于基因组、转录组、蛋白组、代谢组等多组学数据的整合与分析,尤其在家畜基因组估计育种值(genomic estimated breeding value,GEBV)的计算、基因型数据的填充和蛋白质结构及功能的预测等方面取得重要突破。作者介绍了几种常见的机器学习算法的概念和原理,对机器学习算法在重要家畜(猪、牛、羊)遗传育种方面取得的重要研究成果进行综述,进一步讨论了各种机器学习算法的优缺点、以及应用在动物遗传育种中存在的一些问题。最后,对机器学习的未来发展进行了归纳及展望,旨在提高预测准确性及效率,加快种群遗传进展,快速实现精准育种。