AI系统可以学习设计用于研究的RNA分子
2019年01月04日 由 浅浅 发表
471186
0
核糖核酸(RNA)存在于所有活细胞中。它充当信使,携带来自DNA(脱氧核糖核酸)的指令。当它不能正常工作时,它会严重影响神经系统、心血管和肌肉的调节过程,导致肿瘤、胰岛素抵抗和运动技能障碍等。
弗莱堡大学计算机科学系的研究人员开发出一种AI系统LEARNA,可以学习设计用于研究的RNA分子。他们在新论文“Learning to Design RNA”中对此进行了描述。
“最近,设计RNA分子引起了人们对医学,合成生物学,生物技术和生物信息学的兴趣,因为许多功能性RNA分子参与了转录,表观遗传学和转化的调控过程,”研究人员写道,“我们提出了一种新的RNA设计问题算法。”
正如论文作者所解释的,RNA的功能取决于其结构特性。真正的挑战,有时被描述为RNA逆折叠,指识别RNA中的模式和序列,使其折叠成特定的结构。
研究人员的方法依赖于深度强化学习(RL)算法,训练可以顺序预测整个RNA序列的策略网络。它生成此序列,折叠它,并使用从结果结构到目标结构的距离作为AI智能体的信号。
同时,LEARNA的第二个版本,名为Meta-LEARNA,在许多RNA设计问题中学习单一策略,这些问题直接适用于新的RNA设计问题。也就是说,它学习了一个量身定制的生成模型,通过选择放置核苷酸(RNA和DNA的化学构建块)的动作来构建RNA序列样本,用于给定的RNA靶结构。
“据我们所知,这是第一次将架构搜索应用于RL和元学习。”研究人员写道。
在具有20个处理器核心的机器上对8000种不同RNA目标结构进行元学习一小时后,Meta-LEARNA成功解决了Eterna100基准测试中65%的目标结构。
Eterna100是由Eterna的玩家创建的100个目标结构的集合,Eterna是一个在线开放实验室,玩家可以通过创建特定结构的序列来完成任务。此外,它只需要90秒即可达到与其他方法相同的效果,并在三分钟内达到最先进的性能。
同时,在另一个基准Rfam-Taneda上,Meta-LEARNA在10秒内产生了与最先进方法一样好的结果,并在1分钟后准确性超过了这些方法。这对未来RNA生物学的研究是个好兆头。
研究人员写道:“全面的实证结果表明,我们的方法在所有基准测试中都达到了新的最先进的性能,同时,在达到之前的最先进的性能方面,也可以更快地达到数量级。”
论文:
arxiv.org/pdf/1812.11951.pdf