本发明提供一种基于区块链和强化学习的空调控制方法及其系统,该方法包括在空调启动或正常运行时,基于接收到的控制指令和状态参数s,根据奖励机制产生在当前状态下的执行奖励;设定时间窗口Ti,判断当前时间是否在时间窗口Ti内,若判断结果为是,则直接启动强化学习的计算任务,并输出预测动作a;若判断结果为否,则判断是否有其他Master节点发送的计算任务,如是,则启动计算任务;由区块链节点记录当前状态、奖励和动作,并将动作传递给空调,至此完成一轮计算任务。该系统应用于上述的方法。本发明应用于空调的节能控制领域,用以解决目前现有技术中存在的训练困难、稳定性差、浪费计算资源、消耗电力等各种问题。
声明:
“基于区块链和强化学习的空调控制方法及其系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)