Clarifai:反馈循环长期保持高质量的AI结果
2019年06月13日 由 张江 发表
897996
0
上个月,纽约市主办了2019年O Reilly AI大会。包括我们的首席执行官兼创始人Matt Zeiler在内的业内人士以及其他领域的专家,分享了关于人工智能如何改变商业格局的认识。
Matt的谈话是,关闭AI循环:如何长期保持高质量的AI结果,主要探讨人工智能系统的准确性随着时间而下降的问题。
虽然许多开发人员在大量标记的数据和概念上训练AI模型,但过了一段时间,为这些模型添加新的,未标记的输入会导致性能下降。幸运的是,有一种方法可以限制这个问题并保持AI结果准确:反馈循环。在Clarifai,“关闭循环”确保我们的模型保持其性能和改进,即使我们添加新数据。
下面我将定义这个过程,看看它是如何工作的,并讨论它为何如此有价值。
AI反馈循环
反馈循环指的是重复使用AI模型的预测输出来训练模型的新版本的过程。
它是如何工作的?
当我们训练计算机视觉模型时,我们必须先给它一些标记的样本,显示想要学习的概念的正面和负面的例子。然后,我们可以使用未标记的数据测试模型。通过使用深度学习和神经网络,模型可以预测所需的概念是否在这些未标记的图像中。最后,给每个图像一个概率分数,分数越高意味着其预测的置信度越高。
在模型给出图像高概率分数的情况下,它用预测的概念自动标记。但是,在某些情况下,与Clarifai的企业客户一样,如果模型返回的概率分数较低,则会将此输入发送给人工审核,他们会验证并在必要时更正结果。
以下是我们的NSFW模型的反馈循环示例。
当标记的数据(自动标记的或人工验证的)作为训练数据反馈给模型时,发生反馈循环。
类比
概念:学前班的孩子正在学习数数。
训练:教师举起手指并告诉学生相应的数字。对于数字“One”或“1”,举起一根手指。对于数字“Two”或“2”,举起两根手指,依此类推。
测试:教师给孩子们一张工作表,上面有几张未标记的手指。孩子们的任务是用正确的数字标记每个图像。
自动标记(通过人工验证):当学生识别某些图像中显示的手指数量时,他们对其他图像不太确定。因此,当收集工作表时,教师将标记正确的答案并更正错误的答案。
反馈循环:教师将修正后的工作表返回给每个学生,供他们查看以后的课程。
帮助AI长期保持高质量的结果
机器学习技术,如深度学习,允许计算机视觉模型采用标记的训练数据,并学习在后续图像中识别这些概念。虽然为模型提供新的测试数据至关重要,但通过提供已预测的模型数据,我们正在加强其训练。
当教师对试卷进行评分并返回带有复选标记的正确答案并对错误答案进行更正时,学生实际上可以明白对错。反过来,这有助于将课程带回家复习,使学生在下一次测验中做得更好。
至于说之前,模型使用,设法模仿人类大脑的神经网络。通过反馈循环,可以让模型有机会了解它已经学过的内容,这样它就可以不断学习这些数据并在将来表现更好,就像学习中的学生一样。
反馈循环确保AI结果不会停滞。显著的优势是,用于训练模型新版本的数据具有与客户关心的预测相同的实际分布。如果没有它们,即使路径错误,AI也将选择阻力最小的路径,导致其性能恶化。通过结合反馈循环,你可以加强模型的训练并使其随着时间的推移而不断改进。