一种用于开发强化学习系统的框架及方法,其特征在于它是由与外部环境交互的学习者接口、表示环境状态的状态接口、系统通过执行部件执行动作的动作接口、基本的测试环境等部分组成框架,然后利用框架开发强化学习系统,其中学习者接口通过状态接口获取环境状态,经过学习更新内部状态并做出决策,调用动作接口作用于环境,同时提供了本研究组提出的新的基于量子理论的多机器人强化学习算法实现作为实例演示。开发人员只需要按照一定步骤实现相应的接口即可完成机器人或其他智能装置学习模块的开发。本发明可移植性高,可以在众多平台运行,可与其他机器人系统框架结合使用,大大降低了学习算法编写的复杂度,方法简单。
声明:
“用于开发强化学习系统的框架及方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)