强化学习,深度学习的合作伙伴
2019年12月12日 由 KING 发表
584910
0
今年,我们已经看到了有关AI深度学习的许多研究。借助最新的研究成果,深度学习证明了其在许多行业中执行诸如图像识别、语音识别、价格预测之类任务的实用性。深度学习有一个相对未知的合作伙伴:强化学习。当AI研究人员冒险进入未知的学习领域并尝试提供AI学习功能,强化学习将发挥关键作用。
什么是强化学习?
想象一个通过与环境互动来学习的孩子。每次互动都会产生一种感觉,可以带来反馈。例如,花的宜人香味会诱使孩子再次去闻花的气味。花茎刺引起的疼痛会提醒孩子,避免再次触摸茎梗。
在每种情况下,当孩子与环境互动时,环境都会通过反馈孩子不同的感觉来往复运动并教给孩子。这孩子正在反复试验中学习。
这就是强化学习。在强化学习中,主体从中立状态开始,然后在采取措施时,环境帮助主体从中立状态过渡到其他状态。在这些其他状态下,可能会对主体有所反馈。
强化学习的应用
强化学习已经在许多行业中广泛使用,例如制造、库存管理、交付管理和金融。
在制造业中,机器人使用强化学习在装配线上精确地按顺序学习特定任务。
在交付管理系统中,强化学习可用于在不同路线的不同车辆之间划分客户的订单,以到达目的地。
在金融行业中,强化学习用于评估实现金融目标的交易策略。
大多数时候,这些强化学习算法与深度学习算法集成在一起,以创建可以处理更复杂任务的深度强化学习算法。
强化学习在人工智能中的作用
人工智能研究的最重要方面之一是强化学习领域。深度学习使AGI能够发现隐藏的模式以建立联系,而强化学习使AGI可以进行抽象以理解模式背后的含义并进而指导行为。
在深度强化学习中将深度学习与强化学习相结合时,AGI可以计划,理解和制定应采取的行动。
DeepMind的MuZero算法就是一个例子,它是一种深度强化学习算法,能够构造代理,这些代理可以在不知道规则的情况下计划如何下棋和下棋。
这是人工智能的第一步。
如果AI可以使用有限的数据来计划,理解和制定行动计划,而无需明确地“教导”,那么AI就会更接近实现通用情报。
结论
在未来,我们可能会看到深度强化学习算法在不同行业中的更多应用。这是一个令人兴奋的时刻。随着不同行业中的许多应用,这些算法的使用将变得更加普遍和复杂。通过大量的研究和应用迭代,我们可以真正看到有一天可能实现通用智能的AI的潜力。