本发明提供一种在车辆的控制中能够在车辆的生命周期中持续地兼顾强化学习中的探索和利用的控制装置。其使用强化学习对规定系统进行规定的控制,控制装置具有:检测单元,其对规定系统的生命周期中的事件进行检测;设定单元,其根据检测到事件这一情况,将根据检测到的事件而确定的探索参数设定为对强化学习中的探索的比例进行调整的值;以及处理单元,其按照所设定的探索参数来执行使用了强化学习的规定的控制,在检测到第一事件的情况下,设定单元以如下方式设定探索参数:使在作为第一事件之后的第一期间设定的探索的比例小于在检测到第一事件之前的第二期间设定的探索的比例。
声明:
“控制装置、控制装置的控制方法、记录介质、信息处理服务器、信息处理方法以及控制系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)