技术摘要:
本公开涉及一种语音合成方法、声码器训练方法、装置、介质及电子设备。方法包括:获取待合成文本中各音素对应的每一语音帧的声学特征信息;将每一所述语音帧的声学特征信息输入至声码器中,得到所述待合成文本对应的音频信息,其中,所述声码器为基于扩张卷积神经网络 全部
背景技术:
语音合成声码器从基频、频谱等声学特征中重构语音波形,是语音合成系统中不 可或缺的一部分,其中,合成语音的准确度、自然度以及合成速度是衡量声码器性能的重要 指标。近年来,随着深度神经网络模型在声学建模中的成功应用,语音合成的准确度和自然 度均得到了有效改善,但语音合成的速度不够理想。因此,如何在保证合成语音的准确度和 自然度的情况下,提升语音合成的速度成为声码器的研究重点。
技术实现要素:
提供该部分内容以便以简要的形式介绍构思,这些构思将在后面的