从错误中学习的工人机器人
2020年01月31日 由 yining 发表
558550
0
“熟能生巧”——这是一句帮助人类变得高度灵巧的格言,而现在这一方法正被应用到机器人身上。
利兹大学(University of Leeds)的计算机科学家正在利用人工智能(AI)技术进行自动规划和强化学习,训练机器人在杂乱的空间(如仓库货架或冰箱)找到物体并移动。
其目的是发展机器人的自主性,这样机器就可以评估任务中呈现的独特环境并找到解决方案——就像机器人将技能和知识转移到新问题上一样。
最大的挑战是,在一个封闭的区域,机器人手臂可能无法从上面抓住物体。相反,它必须计划一系列的移动来到达目标对象,可能是通过操纵其他项目来实现的。计划这样一项任务所需的计算机功率是如此之大,机器人常常会停顿几分钟。当它真的执行这个动作时,它经常会失败。
利兹大学的计算机科学家们把人工智能的两个想法结合在一起,发展出“实践即完美”的理念。
一是自动化规划。机器人能够通过视觉系统“看到”问题,实际上是一幅图像。机器人操作系统中的软件模拟了它可能为达到目标物体而进行的动作序列。
但是,被机器人“排练”的模拟未能捕捉到真实世界的复杂性,当它们被实现时,机器人无法执行任务。
因此利兹的团队将计划与另一种人工智能技术相结合,称为强化学习。
强化学习涉及到计算机一系列的尝试和错误的尝试——总共大约10000次——来达到和移动物体。通过这些尝试和错误,机器人“学习”它计划的哪些行动更有可能以成功告终。
计算机自己进行学习,从随机选择一个可能有效的计划动作开始。但是,当机器人从尝试和错误中学习时,它会更善于选择那些有更大成功机会的计划动作。
计算机学院的马特奥·莱昂内蒂博士说:“人工智能擅长让机器人进行推理——例如,我们已经看到机器人参与与大师们的国际象棋比赛。
但机器人并不擅长人类擅长的工作:高度机动性和灵巧性。这些物理技能已经被硬连接到人类大脑中,这是进化的结果,也是我们实践、实践和实践的方式。
“这是我们正在应用于下一代机器人的一个想法。”
据撰写这篇研究论文的博士生Wissam Bejjani说,机器人发展出一种概括能力,将它所计划的应用到一组独特的环境中。
他说:“我们的工作意义重大,因为它将计划和强化学习结合起来。很多试图开发这项技术的研究都集中在其中一种方法上。“我们的方法已经被我们在大学机器人实验室看到的结果所证实。
计算机学院副教授Mehmet Dogar博士也参与了这项研究。他说,这种方法使机器人的“思考”时间加快了10倍——50秒的决定现在需要5秒。
这项研究得到了英国工程和物理科学研究委员会(UK Engineering and Physical Sciences research Council)的资助,该委员会的一个项目旨在研究机器人学中的“类人物理学”。