本发明公开一种扩散分子通信环境下基于强化学习的多层自适应奖励目标溯源方法。首先输入算法所需的参数,设计多层阈值模型和分子探测器的运动方式;然后,让分子探测器探索若干回合获取阈值的初始值并更新奖励信息;最后,以固定回合数更新多层阈值,接收机经过若干次迭代之后找到目标。本发明能够解决复杂扩散分子通信环境下分子探测器的路径规划问题。该方案具有定位精度高、复杂度低、快速定位等优点。
声明:
“扩散分子通信环境下基于强化学习的多层自适应奖励目标溯源方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)