本发明提供一种用于进行使用了机器人的缺陷检查的机器学习装置、机器人控制系统以及机器学习方法。机器学习装置具有:状态信息取得部,其从机器人控制检查系统取得包含缺陷检测信息、机器人机械手的移动路径和工件的拍摄点、照相机的拍摄次数在内的状态信息s,机器人控制检查系统使机器人机械手把持工件或者照相机来进行工件的缺陷检查,缺陷检测信息包含工件的缺陷检测部位;行为信息输出部,其输出状态s的调整信息即行为a;回报计算部,其根据包含缺陷检测部位的缺陷检测信息,计算强化学习中的回报值;价值函数更新部,其根据由回报计算部计算出的回报值、状态s、行为a来进行强化学习,由此更新行为价值函数Q。
声明:
“机器学习装置、机器人控制系统和机器学习方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)