本发明公开了一种基于强化学习的服务任务调度方法,能对一段较长时间内的服务任务需求下的服务人员调度给出较为合理的安排。首先根据服务任务需求对服务任务进行数学建模,构建服务任务环境。然后使用ε‑Greedy方法在服务任务环境中进行半随机服务人员工作安排,同时使用强化学习方法对半随机人员工作安排过程进行学习,即从不同调度安排之间的价值差异中进行学习,使深度神经网络近似不同调度安排的价值。最后通过使用深度神经网络对实际服务任务需求下不同调度安排的价值进行预测,然后选择输出较优的满足服务任务需求的服务人员调度安排的班表。本发明构建的基于强化学习的服务任务调度方法具有安排速度快、任务班表安排合理的特点。
声明:
“基于强化学习的服务任务调度方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)