深度学习帮助了解基因的相互作用

2019年12月11日 由 KING 发表 670926 0

卡内基梅隆大学计算机科学家采用了一种深度学习方法,近年来彻底改变了人脸识别和其他基于图像的应用程序,并将其功能重定向到探索基因之间的关系。


他们说,诀窍在于将大量的基因表达数据转换成图像,善于分析视觉图像的卷积神经网络(CNN)随后可以推断出哪些基因正在相互作用。CNN在此任务上的表现优于现有方法。研究人员今天在《美国国家科学院院刊》上发表一篇论文,关于CNN如何帮助鉴定与疾病相关的基因以及可能成为药物靶标的发育和遗传途径。但是计算生物学和机器学习教授Ziv Bar-Joseph 表示,名为CNNC的新方法的应用可能远远超出了基因相互作用的范围。


Bar-Joseph说:“十年前开发的CNN具有革命性意义。有时我们会把这项技术视为理所当然的,因为我们一直在使用它。但是它功能强大,而且不仅限于图像。这完全取决于您如何表示数据。”


在这种情况下,Bar-Joseph和其它研究人员正在研究基因关系。人类大约有20000个基因协同工作,因此有必要知道基因如何在复合体或网络中协同工作以了解人类发育或疾病的有关问题。推断这些关系的一种方法是查看基因表达,它代表细胞中基因的活性水平。通常,如果基因A同时激活,则基因B激活,这就是两者相互作用的线索。但这可能是一个巧合,或者两者都被第三个基因C激活。已经开发了几种先前的方法来弄清楚这些关系。


为了使用CNN来帮助分析基因关系,Bar-Joseph使用了单细胞表达数据,这些实验可以确定单个细胞中每个基因的水平。然后,以矩阵或直方图的形式排列成千上万个这些单细胞分析的结果,以使矩阵的每个细胞代表一对基因的不同共表达水平。


以这种方式呈现数据增加了空间方面,这使得数据更像图像,因此更易于CNN使用。通过使用已经建立了相互作用的基因数据,研究人员能够训练CNN识别哪些基因在相互作用,哪些不是基于数据矩阵中的视觉模式。研究人员Yuan说:“区分因果关系和相关性非常非常困难,但是CNNC方法在统计上比现有方法更准确。他和Bar-Joseph期望CNNC将成为研究人员最终将用于分析大型数据集的几种技术之一。


Bar-Joseph说:“这是一种非常通用的方法,可以应用于许多分析。 主要限制是数据,数据越多,CNN的工作效果越好。细胞生物学非常适合使用CNNC,因为典型的实验可能涉及成千上万个细胞并产生大量数据。

欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
写评论取消
回复取消