本发明涉及机器学习装置、机器学习方法以及记录介质。本发明生成用于适当地输送输送物的驱动源的控制信息。在学习沿着输送路径连续地输送至少2个输送物的输送装置中的驱动源的行动的机器学习装置中,基于设置于输送路径的检测部的检测结果,获取至少2个输送物在输送路径上的位置信息,并基于获取到的位置信息,根据预先决定出的规则来计算报酬,并基于获取到的位置信息和计算出的报酬计算强化学习的行动价值,来学习行动,并生成用于使驱动源进行基于学习结果确定出的行动的控制信息并输出。
声明:
“机器学习装置、机器学习方法以及机器学习程序” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)