关键词:
策略搜索
DMP
形状参数
机械臂
强化学习方法
相关熵
学习系统
摘要:
一、机器人学习
对于机器人的想像几乎伴随着人类社会的历史,尤其是有了电影记录以来,从超能陆战队到超能查派,从机器人与弗兰克到太空旅客,人们对于机器人的想象越来越具象化.虽然这些机器人有各种形态,但共同的是这些机器人都具有多种多样的功能与极强的适应能力,而这点与我们真实看到的具有行动能力的机器人(主要是工业机器人和扫地机器人)有很大的不同.那么如何让机器人具有多样化且能自适应的能力就成为服务机器人应用的挑战,这个挑战实际上就是要让机器人具有学习能力,包括对于新的技能的学习以及在执行技能时具有自我优化的能力.虽然像扫地机器人这样的机器人具有一定的未知场景的适应能力,但当我们需要机器人去做更复杂的任务如端茶倒水、开门关门、擦桌做饭等时,都需要控制机械臂来自适应地执行多样化任务.