logo好方法网

语音波形生成


技术摘要:
本公开内容提供了用于生成语音波形的方法和装置。可以接收与输入相关联的基频信息、声门特征和声道特征,其中声门特征包括相位特征、形状特征和能量特征。基于基频信息和声门特征通过第一神经网络模型来生成声门波形。基于声门波形和声道特征通过第二神经网络模型来生  全部
背景技术:
语音编码器用于统计参数语音合成(SPSS)系统中的语音参数化和波形生成。合成 分析的质量反映了自然性和相似性的最终合成语音质量。基于源滤波器的语音编码器是参 数化、修改和重构波形的最流行和高质量方法之一,例如,STRAIGHT、GlottDNN、IT-FTE等, 提出这些方法以提高感知质量,同时缓解“嗡嗡”和“低沉”问题。存在两种广泛使用的根据 文本来产生高质量语音的范例:统计参数语音合成(SPSS)和单位选择(US)。SPSS和UC方法 之间的差异主要在于激励信号的提取和参数化方法。虽然现有的语音编码器已经提高了合 成语音的感知质量,但是由于存在一些不准确的假设,其在参数化和重构阶段期间引起了 不可避免的损失。
技术实现要素:
提供本
下载此资料需消耗2积分,
分享到:
收藏