本发明提供了一种基于强化学习的网络舆情装置的调度方法,包括:S1:建立一个深度强化学习模型;S2:调度一个网络舆情装置执行目标操作行为并记录所述操作行为;S3:在进行所述S2的调度前先根据所述S1中的深度强化学习模型对所述网络舆情装置的状态进行判断,然后所述网络舆情装置执行操作;S4:保存所述S3执行完成时的所述网络舆情装置的状态记录并以此计算出奖励分数;S5:根据所述S4中得到的所述奖励分数计算损失值以更新所述深度强化学习模型的参数;S6:根据所述S5中更新后的所述深度强化学习模型进行网络舆情预测。
声明:
“基于强化学习的网络舆情装置的调度方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)