本发明公开了一种基于动作采样的强化学习知识图谱推理方法。该发明针对传统知识图谱强化学习推理算法中表征能力不足、无效冗余动作选取以及无记忆组件问题,根据表示学习方法在数据集上的原始事实预测评分,针对性地选取适应性更强的表示学习方法来表示强化学习环境以增强算法表征能力;设计动作采样器以减少智能体在游走过程中的无效冗余动作选择;以LSTM为记忆组件,将历史信息进行编码以增加模型精度,这使得本算法可以在摆脱预训练的情况下取得优于基于路径的推理算法的效果。该方法将智能体在环境中游走得到的路径映射到三层LSTM策略网络,通过动作采样促进智能体选择更有意义的路径,最终实现较为准确的实体关系路径学习。
声明:
“基于动作采样的强化学习知识图谱推理方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)