加州理工学院的研究人员开发DNA试管人工神经网络识别手写数字
2018年07月05日 由 浅浅 发表
244912
0
加州理工学院的研究人员开发了一种由DNA制成的人工神经网络,可以解决经典的机器学习问题:正确识别手写数字。这项工作是证明将人工智能编入合成生物分子电路的能力的重要一步。
这项工作是在生物工程助理教授Lulu Qian的实验室完成的。一篇描述该研究的论文在7月4日发表在网络,和7月19日出版的Nature杂志上。
Qian表示,“虽然科学家们刚刚开始探索在分子机器中创造人工智能,但其潜力已经不可否认,类似于电子计算机和智能手机如何使人类比一百年前更有能力,人造分子机器可以制造所有由分子组成的物体,可能包括油漆和绷带,在未来的一百年里,对环境的能力更强,反应更灵敏。“
人工神经网络是受人类大脑启发的数学模型。尽管与其生物学对应物相比被大大简化,但人工神经网络的功能类似于神经元网络并且能够处理复杂信息。这项工作的最终目标是利用DNA制作的人工神经网络对智能行为(计算,做出选择等的能力)进行编程。
“人类每个人的大脑中都有超过800亿个神经元,它们做出了非常复杂的决定。较小的动物如蛔虫可以使用几百个神经元做出更简单的决定。在这项工作中,我们设计并创造了像一个小的神经元网络对分子信息进行分类,比以前更加复杂。”
为了说明基于DNA的神经网络的能力,实验室研究生Kevin Cherry选择了一项任务,这是电子人工神经网络的一个经典挑战:识别手写。
人类手写可以有很大的不同,因此当一个人仔细检查一个潦草的数字序列时,大脑会执行复杂的计算任务以识别它们。因为即使是人类也难以识别其他人的潦草书写,识别手写数字是将智能编程到人工神经网络中的常见测试。必须教会这些网络如何识别数字,考虑手写的变化,然后将未知数字与其所谓的记忆进行比较并确定数字的身份。
在论文中描述的作品中,作为论文的第一作者,Cherry表明,由精心设计的DNA序列制成的神经网络可以进行规定的化学反应,以准确识别“分子手写”。与几何形状不同的视觉手写不同,分子手写的每个例子实际上都不是数字的形状。相反,每个分子数由20个独特的DNA链组成,这些DNA链选自100个分子,每个分子代表任何10×10模式的单个像素。将这些DNA链在试管中混合在一起。
Qian指出,“缺乏几何形状在自然分子特征中并不少见,但仍然需要复杂的生物神经网络来识别它们,例如,独特气味分子的混合物包含着气味。”
给定分子手写的特定示例,DNA神经网络可以将其分类为多达九个类别,每个类别代表从1到9的九个可能的手写数字中的一个。
首先,Cherry构建了一个DNA神经网络区分手写的6和7。他测试了36个手写数字,并且试管神经网络正确识别了所有这些数字。他的系统理论上能够将超过12000个手写进行两种可能的分类,其中90%的数据来自于一个手写数字数据库,这些数字被广泛用于机器学习。
这个过程的关键是使用由Qian和Cherry开发的DNA分子编码“winner take all”的竞争策略。在该策略中,在确定未知数字的身份时,使用被称为歼灭者的特定类型的DNA分子来选择获胜者。
“歼灭者与来自一个竞争者的一个分子和来自不同竞争者的一个分子形成复合物,并形成惰性的,非反应性的物种,”Cherry说。“歼灭者迅速吞噬所有竞争对手的分子,直到只剩下一个竞争对手的物种。然后,获胜的竞争对手恢复到高浓度并产生荧光信号,表明网络的决定。”
接下来,Cherry建立在他的第一个DNA神经网络的原理上,开发一个更复杂的,一个可以从1到9分类的单个数字。当给出一个未知数字时,这个smart soup会经历一系列的反应,输出两个荧光信号,例如,绿色和黄色代表5,或绿色和红色代表9。
Qian和Cherry计划开发人工神经网络,可以从添加到试管中的实例中学习,形成“记忆”。这样可以训练同样的smart soup来执行不同的任务。
“常见的医学诊断检测到一些生物分子的存在,例如胆固醇或血糖。”Cherry表示,“使用像我们这样更复杂的生物分子电路,诊断测试未来可能包含数百种生物分子,分析和响应直接在分子环境中进行。”