本发明涉及一种强化学习三态组合长短时记忆神经网络系统,包括长短时记忆神经网络、强化学习单元和单调趋势识别器,单调趋势识别器判断由输入时间序列的趋势状态,强化学习单元为根据输入时间序列的趋势状态,选择一个隐层层数和隐层节点数与其变化规律相适应的长短时记忆神经网络,其中,输入时间序列的趋势状态包括三种状态,每个趋势状态对应一个隐层层数和隐层节点数与其变化规律相适应的长短时记忆神经网络。本发明判断输入时间序列的趋势,根据更新后的Q值集来选择执行最优的动作,增强了网络泛化能力,对于旋转机械的退化趋势具有较高的预测精度;通过输出误差计算奖励,提高了网络的收敛速度,提高了系统的计算效率。
声明:
“强化学习三态组合长短时记忆神经网络系统及训练和预测方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)