本发明属于视觉技术领域,具体涉及一种基于深度强化学习仿人足球机器人的实时主动视觉方法,包括如下步骤:选择方法、目标测定、训练过程和细节,所述选择方法通过定义马尔可夫决策过程来将问题表述为一个情景性强化学习问题,同时从当前的环境状态得到一个准确的信念;所述目标测定根据机器人和球的位置确定最佳视角,并采用基于熵的方法评估自定位视角的效率;所述训练过程和细节基于熵的算法输出用于机器人头部的在线控制,使用深度Q‑learning方法解决情景性强化学习问题。
声明:
“基于深度强化学习仿人足球机器人的实时主动视觉方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)