本发明公开了属于
新能源汽车优化管理技术领域的一种基于深度强化学习的集群电动汽车充电行为优化方法。本发明为基于双延迟深度确定性策略梯度算法,实现对电动汽车的功率连续可调充电过程进行建模,训练智能体控制充电功率,优化电动汽车充电行为,将分时电价高时的负荷向电价低时进行转移,达到减少用户充电开销,平抑电网峰时负荷的目的;相较于传统的优化控制方法,TD3在速度和灵活性上优势明显,且可以有效克服以往的强化学习方法动作空间离散、训练收敛困难、稳定性差的问题。为增强智能体的泛化能力,本发明在原有状态观测上添加噪声,模拟一组初始SOC不同,到达与驶离时间各异的电动汽车,并扩展到集群电动汽车充电行为控制。
声明:
“基于深度强化学习的集群电动汽车充电行为优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)