麻省理工的人工智能模型用最少的训练数据来学习对象之间的关系。

2019年04月03日由 Hannah 发表 524762 0

[caption id="attachment_38865" align="aligncenter" width="578"]

研究人员训练了一个混合AI模型来回答诸如“绿色立方体左边的红色物体与紫色哑光物具有相同形状吗？”之类的问题。
图片来源：Justin Johnson / Stanford[/caption]

深度学习系统通过统计模式挑选数据。但是统计学习需要大量的数据，而且它并不特别擅长将过去的知识应用于新的情况。这与符号化人工智能不同，符号化人工智能记录了实现决策所采取的一系列步骤，与传统方法相比，数据更少。

麻省理工学院、麻省理工学院-IBM沃森人工智能实验室和DeepMind的一个研究小组进行的一项新研究表明，符号化人工智能应用于图像理解任具有很大的的潜力。他们说，在测试中，他们的混合模型成功地学习了与对象相关的概念，如颜色和形状，利用这些知识在一个场景中用最少的训练数据和“无显式编程”来推测对象关系。

“孩子们学习概念的一种方式是把文字和图像联系起来，”研究的主要作者毛家源在一份声明中说。“能够以同样的方式学习的机器需要的数据少得多，而且能够更好地将其知识转移到新的场景中。”

该团队的模型包括一个感知组件，该组件将图像转换为基于对象的表示，以及一个语言层，该语言层从单词和句子中提取含义，并创建“符号程序”（即指令），告诉人工智能如何回答问题。第三个模块在场景中运行符号程序并给出答案，当模型出错时更新模型。

研究人员将其训练在与斯坦福大学的CLEVR图像理解测试集的相关问题和答案配对的图像上。（例如：“物体的颜色是什么？”和“有多少物体都是绿色圆柱体的右边，和蓝色小球的材质相同？”）随着模型的学习，问题变得越来越难，一旦它掌握了对象级的概念，模型就开始学习如何将对象及其属性相互关联。

在实验中，它能够“几乎完美地”解释新的场景和概念，研究人员报告说，它轻而易举地击败其他前沿人工智能系统，仅使用5000张图像和100000个问题（相比之下，其他系统使用70000张图像和700000个问题）。该团队将致力于未来的工作，改进其在真实照片上的性能，并将其扩展到视频理解和机器人操作。

标签：

机器学习计算机视觉

0 评论

欢迎关注ATYUN官方公众号

商务合作及内容投稿请联系邮箱:bd@atyun.com

上一篇研究人员发现，基于文本的人工智能模型更容易被改写攻击

下一篇人工智能胶囊系统实现最先进的图像分类结果

评论登录

要发表评论，您必须先登录。

jonatasgrosman/wav2vec2-large-xlsr-53-english facebook/dino-vitb16 bert-base-uncased xlm-roberta-large xlm-roberta-base gpt2 microsoft/resnet-50 facebook/dino-vits8

AGENTIC AI如何塑造未来