一种强化学习辅助的大规模MIMO的Damped‑BP检测方法,采用强化学习中的Q‑Learning算法寻找阻尼置信传播Damped‑BP算法中的最佳阻尼因子,以此来提升Damped‑BP检测算法的性能。将Damped‑BP算法中的阻尼因子大小作为Q‑Learning算法中的状态,动作设置为增大或减小阻尼因子,形成Q‑Table。通过每次BP算法得到的误码率大小来决定给系统一个正向还是负向的回馈,误码率小,则给一个正向的回报;误码率大,则给一个负向的回报。这样,通过合理设置Q‑Learning算法中的学习率、折扣因子以及训练次数,得到在某种动作下回报最大的状态,与之对应的阻尼因子也就是最佳阻尼因子,从而完成最佳阻尼因子寻找,提升了Damped‑BP检测算法的性能,进而提升大规模MIMO的检测性能,能更好地满足实际通信高可靠低时延需求。
声明:
“强化学习辅助的大规模MIMO的Damped-BP检测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)