SparkCognition猫与狗的数学:图像识别中的人工智能
2018年08月27日 由 荟荟 发表
482903
0
假设您想编写一个计算机程序来识别猫的图片。一个合理的出发点可能是问自己,“猫看起来像什么?”猫是一种毛茸茸的四足动物,有一个鼻子和一条尾巴。因此,将猫识别任务分解为这些更基本的组件,对计算机进行编程以独立执行每个组件,然后将它们组装成一种清单。打开计算机并将其指向一组图片。它会磨掉一分钟,然后返回结果。你去,一张猫的照片。
好吧,没有人说计算机编程很容易。尽管如此,我们的第一次尝试错误地选择了一只狗的事实并不一定对整体策略是致命的。也许我们的猫类特征清单不够长,或者个别标准不够具体。如果您有一个为您工作的程序员团队,请为其中一些人分配编码形状类似于猫的形状的任务。为他人分配认识猫体特征的任务。每周举行一次会议,鼓励所有团队成员集体讨论新猫类特征的想法。这似乎是一种可行的前进方式。如果我们努力工作,我们最终会到达那里,对吗?
错误。今天的计算世界的共识是,你永远不会到达那里。你可以组建世界上最好的计算机程序员,兽医和摄影师团队来探索猫的图片的本质,50年后,你仍然会看到很多关于猫的图片。不是猫
为什么传统的编程不能处理猫?
这是令人失望的,当然,但也令人惊讶。电脑可以做出惊人的事情。他们可以管理大公司的工资单,玩无与伦比的国际象棋游戏,以及飞往火星的飞行员太空船。普通人不能做任何这些事情。普通人甚至不能像锁在钥匙串上的电子计算器一样算术。但是构建这些机器的程序员也不会。他们所能做的就是将事情分解为最基本的组成部分,理解算术,国际象棋动作和航天机制的微小细节,然后将这种理解重新组合成有用的程序。
分而治之。这是一个具有长期和多变成功历史的战略,化学家将他们的分子和物理学家用夸克向程序员提供他们的算法。但由于某种原因,它不适用于猫。
当然,不仅仅是猫,还有特别是猫。在历史的这一点上,识别图片中的普通物体 - 猫,狗,人,汽车,房屋 - 处于计算机科学研究的最前沿。那么理解简单的口头命令就像“Alexa,现在几点了?”因此,让计算机在街上开车而不打任何东西。这是令人兴奋的事情。这很难。
这些挑战是完全不同的,但除了困难和激动之外,它们还有一些共同点。对于初学者来说,他们顽固地抵制理性的,雾化的,魔鬼般的细节方法,这些方法在国际象棋,航天飞行等方面已经证明是如此成功。它们也不总是,但往往是人类容易找到的东西。很容易,我们很难描述我们如何执行观看,聆听和移动的任务。我们只是这样做。最后,在编程世界中,这些任务目前属于人工智能的总体标题。
这部分只是该术语的可塑性的一个功能,以及程序员将其应用于目前看似困难的任何事物的倾向。(多年来,下棋被认为是人工智能的基准,直到计算机擅长下棋,此时每个人都耸耸肩,悄悄地认为国际象棋一直都是一个固有的计算机问题。)但是,有一种感觉,对这些事物的天赋是一种明显的人性特征。那我们该怎么做呢?
人类(和AI)如何了解猫
我该怎么做?我如何识别猫的照片?嗯,首先,我不考虑它。我只是看,我知道。我不会通过将猫分解成其组成部分来教孩子猫的概念。我只想指着一只猫说“猫”。如果孩子做了同样的事情,我会积极回应。如果孩子误认为狗是一只猫,我会说“不,那是一只狗”,但我不会太过强硬。我会指出邻居的猫。一张猫的照片将被视为一只猫,Hello Kitty贴纸和豹猫也是如此。我不会为了细节而烦恼,也不会过分担心矛盾的刺激。诀窍不是要让孩子明确表达对猫的理解,而只是为了确保他们能够遇到很多猫。
在过去四分之一世纪的人工智能研究中,大部分时间都是这样的洞察力,即计算机不像科学家,更像是儿童。学习 - 或者至少在这个特殊的人类领域学习 - 的关键不是理解而是经验。事实证明,当涉及到模拟计算机的体验时,我们有一个如何做的概念。
给我一百万张猫的照片。给我一百万张非猫的照片。对你我来说这些是图像,但对于计算机而言,它们是像素,字面上只是数字列表。这些天的数码相机分辨率以百万像素为单位,这意味着每张图片都是数百万个数字的列表,但这没关系。一次处理数百万个数字是计算机擅长的。
事实证明,百万只猫图片中的数字平均在统计上与一百万张非猫图片中的数字不同。感知差异减少到数学上的差异。
后者的差异并不明显。我们可能没有描述狗与猫鼻子的长度,但我们知道我们的统计数据。我们有一些技巧。这些技巧通常可归结为将数字加在一起并以繁琐的组合形式组合在一起,这对于人类来说管理起来既繁琐又复杂,但是,嘿,看,我们已经将这些计算机放在周围,并且增加和增加数字发生成为他们真正非常擅长的一件事。也许我们可以在中间见面。
这就是该学科现在所处的位置。人工智能目前被认为是狭义术语机器学习的同义词。这个术语表示通过示例教授计算机的特定技术,就像他们是孩子一样,尽管孩子也是算术学者。拥抱这种技术需要一定的谦逊。你必须接受只是你的工作才能识别猫而不深入了解猫是什么。但作为交换,这项技术是有效的。这是我们最可行的前进方式。
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com