本申请提供一种控制方法、装置、存储介质及电子设备。本申请实施例提供的控制方法,通过获取用于表征待控设备物理状态的状态检测参数,并将状态检测参数输入至预设强化深度学习模型中,以确定与状态检测参数相对应的控制指令,其中,该预设强化深度学习模型是通过实际测量值所构成的第一数据样本集以及根据预设仿真模型与第一数据样本集所确定的仿真模拟值所构成的第二数据样本集进行训练得到的,从而使得基于真实数据以及模拟数据相结合所得到的强化深度学习模型所确定的学习策略的分布更接近真实策略分布,提高基于该深度强化学习模型所确定的控制指令与实际情况的匹配度。
声明:
“控制方法、装置、存储介质及电子设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)