本发明公开了一种基于强化学习的移动数据流量卸载方法,首先基于手机用户上网记录数据,进行用户流量需求分析,分别针对用户总流量和可卸载流量进行统计分析;然后针对运营商、内容提供方和内容需求方,根据运营商效用函数、内容提供方效用函数、内容需求方效用函数和系统总效用函数,利用强化学习方法,求解令系统的总效用目标函数最优化的流量卸载策略。本发明利用强化学习中的Gradient Bandit算法,通过多天长期学习训练,做出最优的流量卸载决策。
声明:
“基于强化学习的移动数据流量卸载方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)