深度学习识别未知的人类祖先,有揭示人类进化的潜力
2019年01月17日 由 浅浅 发表
932144
0
结合深度学习算法和统计方法,来自进化生物学研究所(IBE),基因组调控中心(CRG)中心国家基因组织(CNAG-CRG)和塔尔图大学基因组学研究所的研究人员,通过亚洲个体的基因组,确定了数万年前与现代人类交叉的、全新的原始人类的足迹。
现代人类DNA计算分析表明,已灭绝的人种是尼安德特人与丹尼索瓦人的混血后代,也是走出非洲到亚洲的现代人类的后代。这一发现可以解释在Denisova洞穴中发现的混血,一个尼安德特母亲和一个丹尼索瓦父亲的后代,并不是一个孤立的案例,而是一个更普遍的渗入过程的一部分。
该研究发表于Nature Communications,首次使用深度学习来解释人类进化,为该技术在生物学,基因组学和进化的其他问题中的应用铺平了道路。
未知的人种
区分两个人种的方法之一是,虽然他们都可能交叉繁衍,但通常不会很多产。然而,当涉及灭绝时,这个概念要复杂得多。事实上,当前人类DNA透露的信息模糊了这些限制的线条,保留了其他物种的原始人类碎片,例如尼安德特人与丹尼索瓦人,他们在4万多年前在欧亚大陆与现代人类共存。
现在,进化生物学研究所(IBE),基因组调控中心(CRG)中心国家基因组织(CNAG-CRG)和塔尔图大学的研究人员使用深度学习算法来识别新的祖先。
“大约8万年前,在踏上走出非洲的史诗性旅程之前,当时已经由现代人类组成的人口中的一部分人放弃了非洲大陆并迁移到其他大陆,从而产生了所有现有人口,”国际教育局首席研究员和UPF部门主管Jaume Bertranpetit解释说,“我们知道,从那时起,现代人类与尼安德特人在所有大陆上交叉繁衍,除了非洲。”
破译古代DNA中人类进化的关键
迄今为止,第三祖先的存在只是一种解释当前人类基因组某些片段起源的理论(参与本研究的团队的一部分已经在之前的研究中提出了已灭绝的原始人类的存在)。然而,深度学习使得从DNA转变为祖先种群的人口统计学成为可能。
调查人员不得不面对的问题是,他们分析的人口统计模型要比迄今为止所考虑的任何其他模型复杂得多,并且没有可用于分析它们的统计工具。CNAG-CRG的首席研究员Oscar Lao表示,“我们已经使用这个属性来获得算法,以学习使用通过数十万次模拟获得的基因组来预测人类统计数据。每当我们运行模拟时,我们都在沿着人类历史可能的路径前进。”
论文:
dx.doi.org/10.1038/s41467-018-08089-7