logo好方法网

一种语音处理方法、装置、设备及存储介质


技术摘要:
本申请实施例提供一种语音处理方法、装置、设备及存储介质,其中的方法包括:确定待处理的目标语音帧对应的历史语音帧;获取历史语音帧的频域特征;调用网络模型对历史语音帧的频域特征进行预测处理,得到目标语音帧的参数集;参数集中包含至少两个参数,网络模型包含  全部
背景技术:
语音信号经VoIP系统传输的过程中可能会产生音质损伤的现象。现有技术中,解 决音质损伤的现象的一种主流方案是经典的PLC技术,主要原理是:接收端如果未收到第n (n为正整数)帧语音帧,会对第n-1帧语音帧进行信号分析处理以补偿第n帧语音帧。但实践 发现,由于信号分析处理能力有限,经典的PLC技术的语音处理能力有限,无法适用于现网 突发丢包的场景。
技术实现要素:
本申请实施例提供一种语音处理方法、装置、设备及存储介质,能够弥补传统信号 分析处理技术的不足,提升语音处理能力。 一方面,本申请实施例提供一种语音处理方法,包括: 确定待处理的目标语音帧对应的历史语音帧; 获取历史语音帧的频域特征; 调用网络模型对历史语音帧的频域特征进行预测处理,得到目标语音帧的参数 集;参数集中包含至少两个参数,网络模型包含多个神经网络,神经网络的数量根据参数集 中的参数数量确定; 根据参数集重建目标语音帧。 一方面,本申请实施例提供一种语音处理方法,包括: 接收经VoIP系统传输的语音信号; 当语音信号中的目标语音帧丢失时,采用上述的方法重建目标语音帧; 基于重建的目标语音帧输出语音信号。 一方面,本申请实施例提供一种语音处理装置,包括: 确定单元,用于确定待处理的目标语音帧对应的历史语音帧; 获取单元,用于获取历史语音帧的频域特征; 处理单元,用于调用网络模型对历史语音帧的频域特征进行预测处理,得到目标 语音帧的参数集;参数集中包含至少两个参数,网络模型包含多个神经网络,神经网络的数 量根据参数集中的参数数量确定;以及用于根据参数集重建目标语音帧。 一方面,本申请实施例提供另一种语音处理装置,包括: 接收单元,用于接收经VoIP系统传输的语音信号; 处理单元,用于当语音信号中的目标语音帧丢失时,采用如上述的方法重建目标 语音帧; 5 CN 111554322 A 说 明 书 2/20 页 输出单元,用于基于重建的目标语音帧输出语音信号。 一方面,本申请实施例提供一种语音处理设备,该设备包括: 处理器,适于实现一条或多条指令;以及, 计算机可读存储介质,存储有一条或多条指令,一条或多条指令适于由处理器加 载并执行如上述的语音处理方法。 一方面,本申请实施例提供一种计算机可读存储介质,该计算机可读存储介质存 储有一条或多条指令,一条或多条指令适于由处理器加载并执行如上述的语音处理方法。 本申请实施例中,当需要对语音信号中的目标语音帧进行重建时,可以调用网络 模型对目标语音帧对应的历史语音帧的频域特征进行预测处理得到目标语音帧的参数集, 再通过对参数集进行参数间滤波来实现目标语音帧的重建。这个语音重建恢复的过程将传 统信号分析处理技术与深度学习技术相结合,弥补了传统信号分析处理技术的不足,提升 了语音处理能力;并且基于通过对历史语音帧进行深度学习预测出目标语音帧的参数集, 进而根据目标语音帧的参数集重建目标语音帧,重建过程较为简单高效,更适用于对实时 性要求较高的通信场景;另外,用于重建目标语音帧的参数集中包含两个或两个以上的参 数,这样就将网络模型的学习目标进行了分解,分解成为若干参数,每个参数分别对应不同 的神经网络来进行学习,依据不同的参数集可对不同的神经网络进行灵活的配置组合形成 网络模型的结构,通过这样的方式,能够极大的精简网络结构,并且有效降低处理复杂度。 附图说明 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1示出了本申请一个示例性实施例提供的一种VoIP系统的结构示意图; 图2示出了本申请一个示例性实施例提供的一种语音处理系统的结构示意图; 图3示出了本申请一个示例性实施例提供的一种语音处理方法的流程图; 图4示出了本申请另一个示例性实施例提供的一种语音处理方法的流程图; 图5示出了本申请另一个示例性实施例提供的一种语音处理方法的流程图; 图6示出了本申请一个示例性实施例提供的STFT的示意图; 图7示出了本申请一个示例性实施例提供的一种网络模型的结构示意图; 图8示出了本申请一个示例性实施例提供的基于激励信号的语音生成模型的结构 示意图; 图9示出了本申请一个示例性实施例提供的一种语音处理装置的结构示意图; 图10示出了本申请另一个示例性实施例提供的一种语音处理装置的结构示意图; 图11示出了本申请一个示例性实施例提供的一种语音处理设备的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏