本发明公开了一种基于多智能体强化学习的无线充电设备协作任务卸载策略,使用Q‑Learning算法以及神经网络来学习多个移动设备如何在有限的计算资源和电量资源环境下进行协作任务卸载。本发明首次将多用户协作任务卸载建模为部分可观测马尔可夫决策过程(POMDP)的问题表述,视每个智能体为相互独立的学习者,提出了一种在无线充电D2D网络环境下基于多智能体深度确定性策略梯度(MADDPG)的协作任务执行方案(CACTE),其目标是使多个移动设备彼此有效地协作,从而执行更多任务,获得更高的长期回报。并且,将本发明提出的策略与其他策略在不同实验参数下进行对比,证明了本发明所提出策略的有效性。
声明:
“基于多智能体强化学习的无线充电设备协作任务卸载策略” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)