本发明涉及一种基于深度强化学习和联盟链的能量交易方法、装置及设备,通过采集能量交易场N个影响买卖双方的状态向量构成第一状态矩阵,在神经网络模型中对状态矩阵进行处理、分析得到动作矩阵、第二状态矩阵和奖励矩阵,还采用第一状态矩阵、动作矩阵、第二状态矩阵和奖励矩阵对神经网络模型进行训练,得到神经网络训练模型,基于神经网络训练模型和联盟链的能量交易方法应用的电动汽车的P2P电量交易中,使得参与交易的电动汽车长期收益最大化,并引入了联盟链,保证电动汽车电量交易的隐私安全,解决了在基于联盟链的P2P电量交易中,如何让买方和卖方得到最大长期效益的技术问题。
声明:
“基于深度强化学习和联盟链的能量交易方法、装置及设备” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)