麻省理工的人工智能模型用最少的训练数据来学习对象之间的关系。
2019年04月03日 由 Hannah 发表
524677
0
[caption id="attachment_38865" align="aligncenter" width="578"]
研究人员训练了一个混合AI模型来回答诸如“绿色立方体左边的红色物体与紫色哑光物具有相同形状吗?”之类的问题。
图片来源:Justin Johnson / Stanford[/caption]
深度学习系统通过统计模式挑选数据。但是统计学习需要大量的数据,而且它并不特别擅长将过去的知识应用于新的情况。这与符号化人工智能不同,符号化人工智能记录了实现决策所采取的一系列步骤,与传统方法相比,数据更少。
麻省理工学院、麻省理工学院-IBM沃森人工智能实验室和DeepMind的一个研究小组进行的一项新研究表明,符号化人工智能应用于图像理解任具有很大的的潜力。他们说,在测试中,他们的混合模型成功地学习了与对象相关的概念,如颜色和形状,利用这些知识在一个场景中用最少的训练数据和“无显式编程”来推测对象关系。
“孩子们学习概念的一种方式是把文字和图像联系起来,”研究的主要作者毛家源在一份声明中说。“能够以同样的方式学习的机器需要的数据少得多,而且能够更好地将其知识转移到新的场景中。”
该团队的模型包括一个感知组件,该组件将图像转换为基于对象的表示,以及一个语言层,该语言层从单词和句子中提取含义,并创建“符号程序”(即指令),告诉人工智能如何回答问题。第三个模块在场景中运行符号程序并给出答案,当模型出错时更新模型。
研究人员将其训练在与斯坦福大学的CLEVR图像理解测试集的相关问题和答案配对的图像上。(例如:“物体的颜色是什么?”和“有多少物体都是绿色圆柱体的右边,和蓝色小球的材质相同?”)随着模型的学习,问题变得越来越难,一旦它掌握了对象级的概念,模型就开始学习如何将对象及其属性相互关联。
在实验中,它能够“几乎完美地”解释新的场景和概念,研究人员报告说,它轻而易举地击败其他前沿人工智能系统,仅使用5000张图像和100000个问题(相比之下,其他系统使用70000张图像和700000个问题)。该团队将致力于未来的工作,改进其在真实照片上的性能,并将其扩展到视频理解和机器人操作。