本发明公开了一种基于强化学习的机器学习模型预测时机估计模型,首先采集一组时间序列数据输入到LSTM模型中,得到预测结果;然后将预测结果和时间序列数据同时输入到强化学习模型中,采用两次预测结果交叉熵的差值作为强化学习的奖励函数,得到强化学习模型的决策;最后根据决策数值判断预测结果是否准确,如果不准确,读取下一时刻数据与前述的时间序列数据组合形成新的时间序列数据输入到LSTM模型中进行下一轮的预测,循环进行预测操作。
声明:
“基于强化学习的机器学习模型预测时机估计模型” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)