本发明公开一种基于异步深度强化学习的无线传感器网络拓扑优化方法,利用无标度网络模型的规则生成初始化的无线传感器网络拓扑结构;压缩无线传感器网络拓扑结构;初始化异步深度强化学习模型;训练与测试阶段;在训练阶段,首先对无线传感器网络拓扑结构进行序列化,用一个行向量来表示无线传感器网络拓扑结构;然后,网络拓扑结构行向量分别输入到不同的本地网络训练模型中;其次,本地网络训练模型中包含两个神经网络模型,分别是动作选取策略网络和策略评估网络;测试阶段,全局网络训练模型对测试数据集进行测试评估;重复步骤1、2、3和4;直至最大的迭代次数。
声明:
“基于异步深度强化学习的无线传感器网络拓扑优化方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)