本申请提供了一种乒乓球机器人的深度强化学习旋转速度预测方法及系统,预测方法包括将等时间间隔的乒乓球来球位置序列归一化;将归一化序列输入到深度LSTM网络中;将得到的LSTM的状态向量输入到入射旋转估计深度神经网络中,得到入射旋转速度;计算深度强化学习的奖励反馈;将当前次击球过程的乒乓球来球位置序列、乒乓球入射旋转速度和奖励反馈组合成一次击球记忆,存入记忆库中;从记忆库中随机选取至少一条记忆,将LSTM的状态向量和乒乓球入射旋转速度输入到奖励反馈估计深度神经网络中,输出奖励反馈估计,并对入射旋转估计深度神经网络和奖励反馈估计深度神经网络进行反向传播和参数更新。本申请应对旋转球时能够准确回球。
声明:
“乒乓球机器人的深度强化学习旋转速度预测方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)