本发明公开了一种基于滤波器组频率区分的深度网络波形合成方法及装置,方法包括:采用解析方法设计多个任意频率通带的滤波器组;将生成器输出的语音信号并行馈入到滤波器组中,获得多个窄频带的信号;将窄频带的信号分别输入到各个子鉴别器中进行处理,综合子鉴别器的损失函数对生成对抗网络的参数进行训练,将测试文本馈入到给定的声学模型前端网络中,生成测试梅尔谱,再将该测试梅尔谱输入到生成器中,生成语音信号。装置包括:处理器和存储器。本发明提出的语音波形合成GAN网络解决了高频部分混叠失效的问题,大大减轻了高频频段的频谱失真。
声明:
“基于滤波器组频率区分的深度网络波形合成方法及装置” 该技术专利(论文)所有权利归属于技术(论文)所有人。仅供学习研究,如用于商业用途,请联系该技术所有人。
我是此专利(论文)的发明人(作者)