本发明提供一种基于web检索的实体翻译方法。包括:利用知识库中的实体描述信息和待翻译实体进行web检索;利用所述知识库中的实体描述信息对历史检索结果进行序列标注得到至少一个候选实体翻译;据历史检索结果中的当前字/词的TF‑IDF值以及所述当前字/词与所述待翻译实体共现概率得到至少一个候选增强词;统计所述候选实体翻译和所述候选增强词之间的相关统计量,生成或者更新检索状态表;将所述检索状态表作为强化学习的状态集,将所述至少一个候选增强词以及特殊“结束”动作作为强化学习的动作集,通过强化学习机制得到最优检索增强词选择策略,并在结束时以出现次数最高的候选实体翻译作为最终实体翻译。本发明能够提高实体翻译的准确性和翻译效率,同时能够避免未登录词和实体名歧义性的问题。
声明:
“基于web检索的实体翻译方法” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)