本发明提出的一种基于深度强化学习的低时延高可靠性资源分配方法,考虑了处于基站覆盖范围外的NR‑V2X侧链资源分配,其中车辆根据自己观测到的信息以及在训练阶段得到的Q网络调度5G网络中供V2V用户使用的URLLC切片资源。为了最大化V2V通信的能量效率,并且保证通信的可靠性以及时延要求,提出了一种使用集中式训练、分布式执行的深度强化学习架构,借助DDQN学习方法训练出满足上述要求的模型。将资源分配问题中目标和约束的建模都转化为深度强化学习中收益的设计,可以有效解决V2V用户信道分配和功率选择的联合优化问题,可以在一系列连续动作空间的优化中表现稳定。
声明:
“基于深度强化学习的低时延高可靠性V2V资源分配方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)