本发明实施例提供一种语言模型建立方法及装置。所述方法包括获取语料库,语料库包括至少一个经过分词处理的句子;根据策略函数对所述语料库中的每个句子进行筛选,将满足预设筛选条件的句子组成分词词典;通过对分词词典中每个句子的分析得到语言模型;用语言模型对预先获取的声学模型进行解码以计算损失函数;若根据损失函数和预设的奖励函数得到的奖励值满足预设的优化条件,则判断所述语言模型建立完成,本发明实施例通过策略函数对获取的语料库进行筛选,然后将得到语言模型对声学模型进行解码得到CTC函数,再通过得到的奖励函数对策略函数进行优化改进,从而通过强化学习的方法快速得到需要的语言模型,且能够提高语音识别的准确率。
声明:
“语言模型建立方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)