一种基于视觉反馈和强化学习的柔性臂控制与规划方法,包括:采集目标定位训练样本;对目标定位深度神经网络进行训练;设计针对所述柔性臂的基于Q‑learning的强化学习算法;通过训练好的所述目标定位深度神经网络进行目标检测,检测的输出作为强化学习的输入量,进行强化学习;根据强化学习结果,驱动所述柔性臂完成指定操控任务。本发明的有益效果是:适应范围广,由于强化学习不依赖模型的控制特性,可以适用于解决多种复杂结构的柔性机器人的控制问题,可以在柔性机器人操控领域广泛应用,为目前缺乏有效控制手段的柔性机器人领域提供重要的技术支持。
声明:
“基于视觉反馈和强化学习的柔性臂控制与规划方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)