本发明公开了基于强化学习的病床资源配置优化方法、系统及终端,涉及资源配置优化技术领域,其技术方案要点是:获取多个科室的病床配置数据,并对单一科室的在院患者数进行时间差异分析,得到时间差异分布信息;结合病床配置数据和时间差异分布信息,模拟患者入出院过程建立智能体需要的状态空间、动作空间以及奖赏函数;智能体根据策略函数选择并执行当前状态对应的动作过程中,以最大化累计奖赏为目标,得到多个科室的病床资源配置优化策略。本发明采用机器强化学习(RL)的方法训练智能体,考虑不同科室疾病在时间分布上的差异情况,使得床资源配置优化策略更加符合实际情况,有效提高了病床资源配置优化的准确性与可靠性。
声明:
“基于强化学习的病床资源配置优化方法、系统及终端” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)