本申请涉及内在激励强化学习领域,特别涉及一种基于文本游戏的强化学习情感分析系统,包括如下模块:表示状态的文本描述模块、情绪分析模块、外部环境模块和LSTM‑DQN模型模块,所述表示状态的文本描述模块用于表示状态的文本描述的输入;所述情绪分析模块用于分析所述表示状态的文本描述中的积极和消极轨迹,生成基于情感的奖励;所述外部环境模块用于给出外部环境的奖励;LSTM‑DQN模型模块用于对所述文本描述的状态表示进行编码,使用环境给出的奖励,并从状态表示中提取基于情感的奖励作为补充;本发明将稀疏性奖励问题转化为稠密性奖励问题,提高强化学习在处理所述问题的性能,实现了无奖励环境下的自发学习,提高了强化学习在基于文本游戏中的表现。
声明:
“基于文本游戏的强化学习情感分析系统” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)