本发明公开了一种用强化学习算法对酒店客房进行收益管理的方法,包括状态、智能体、动作和回报;一个所述智能体每次从环境中获取一个状态数据,作为它对当前环境状态的认知,以及一组可执行的动作,所述智能体根据状态从一组动作中采取一个动作进行执行,执行之后所述环境返回一个回报;所述状态指收益管理系统能够获取到的各种酒店运营数据;所述动作指客房的定价和超售量。本发明采用强化学习算法训练模型替代了传统收益管理系统中手工编制的数学模型,降低软件成本,提高预测准确度的效果,利用历史数据和在线数据训练模型,使其达到某种优化目标,相比传统方法的人工建模无需高深的领域知识,并对各种情况有着更广泛的适应性。
声明:
“用强化学习算法对酒店客房进行收益管理的方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)