本发明公开了一种基于深度强化学习的车联网信道资源优化方法及系统,其中方法包括:首先获取目标车辆对应的可用信道资源列表;根据目标车辆中的第一执行网络和可用信道资源列表,确定转移元组;目标车辆将转移元组发送至路测单元;路测单元将接收到的转移元组存入经验回放池;从经验回放池中抽取数据进行训练,并通过最小化损失函数确定网络权重;路测单元将网络权重发送至目标车辆;目标车辆根据网络权重,对第一执行网络和第二执行网络进行更新。本申请实施例让车辆选择合适的信道进行通信,优化了信道资源的分配方式,降低了信道冲突发生的可能;另外,本申请实施例提出中心式训练,分布式决策的框架,能有效提高训练效率。
声明:
“基于深度强化学习的车联网信道资源优化方法及系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)