本发明涉及一种基于深度强化学习的群智感知激励机制方法,获取参与者位置和移动轨迹信息,将参与者移动过程建模为马尔可夫决策过程,采用深度强化学习预测其在下一个激励周期内的移动轨迹,预测参与者在下一个激励周期结束时的位置分布,通过计算参与者的预测位置分布与数据请求方提供的感知数据目标分布的相对熵,选择大于相对熵阈值区域内的参与者进行激励。本发明避免在同一时间段内对所有参与者进行激励、对同一个参与者在所有激励周期内都进行激励,合理的激励机制解决群智感知参与者收集到的感知数据分布情况与数据请求方提供的目标数据分布之间差异较大、覆盖质量较低的问题;可被广泛应用于移动群智感知领域,降低激励参与者的成本。
声明:
“基于深度强化学习的群智感知激励机制方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)