本发明公开了一种通过强化学习训练书法机器人的方法。该方法包括:获取目标书法作品图片,并输入到卷积神经网络进行特征提取,获得图像预处理结果;构建深度强化学习模型,该深度强化学习模型的智能体输出用于控制机器人书写的指令,环境的状态观测量是图像预处理结果;智能体根据输入的状态观测量和奖赏,通过随机梯度下降进行训练,其中奖赏反映机器人书法作品和目标书法作品之间的匹配程度,并且训练过程中,机器人书写的书法作品也作为环境的状态观测量。利用本发明训练的书法机器人不需要人类预先设置书写动作,就能自动学习书法作品与书写动作之间联系,书写出与目标书法作品匹配度更高的作品。
声明:
“通过强化学习训练书法机器人的方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)