logo好方法网

语音匹配方法、装置、计算机设备和存储介质


技术摘要:
本申请涉及一种语音匹配方法、装置、计算机设备和存储介质。所述方法包括:获取待匹配的变声语音;通过语音特征变换模型还原所述变声语音,得到还原语音;将嫌疑人的原始语音与所述还原语音进行声纹比对;当声纹比对的结果为不匹配时,调整所述语音特征变换模型中参数  全部
背景技术:
随着计算机技术的发展,出现了变声技术,通过变声技术可以改变语音的信号特 征,将说话人的语音变为变声语音。在某些场景下,例如在公安人员的办案过程中,需要对 变声语音进行还原,并将还原后的语音和嫌疑人的原始语音进行匹配,以判断变声语音的 说话者是否是嫌疑人。 传统技术中,在利用语音特征变换模型对变声语音进行还原以判断变声语音的说 话者是否是嫌疑人时,对语音特征变换模型的几组典型的信号特征变换参数进行人工试错 和微调,找到可以使还原语音与原始语音最接近的语音特征变换模型的参数。通过人工试 错和微调对语音特征变换模型的参数进行调整,并根据调整后的语音特征变换模型对还原 语音和原始语音进行匹配的方法,操作复杂、工作量大、效率低。
技术实现要素:
基于此,有必要针对上述技术问题,提供一种能够提高语音匹配的效率的语音匹 配方法、装置、计算机设备和存储介质。 一种语音匹配方法,所述方法包括: 获取待匹配的变声语音; 通过语音特征变换模型还原所述变声语音,得到还原语音; 将嫌疑人的原始语音与所述还原语音进行声纹比对; 当声纹比对的结果为不匹配时,调整所述语音特征变换模型中参数的参数值,并返回 所述通过语音特征变换模型还原所述变声语音的步骤进行迭代,直至声纹比对的结果为匹 配时停止迭代或者直至满足迭代停止条件时停止迭代; 根据停止迭代时声纹比对的结果,确定所述变声语音和所述原始语音的匹配结果。 在一个实施例中,所述通过语音特征变换模型还原所述变声语音,得到还原语音 之前,所述方法还包括: 确定语音特征变换模型的至少一种参数;所述至少一种参数表征至少一种用于还原变 声语音的语音特征; 分别选取所述语音特征变换模型的参数的初始参数值; 根据所述语音特征变换模型的参数和所述参数的初始参数值建立语音特征变换模型。 在一个实施例中,所述将嫌疑人的原始语音与所述还原语音进行声纹比对,包括: 分别对嫌疑人的原始语音和所述还原语音进行高通滤波; 分别将已经过高通滤波的所述原始语音和所述还原语音进行分段处理; 将已经过分段处理的所述原始语音和所述还原语音进行声纹比对。 4 CN 111739547 A 说 明 书 2/13 页 在一个实施例中,所述将嫌疑人的原始语音与所述还原语音进行声纹比对,包括: 获取所述原始语音的第一声纹特征和所述还原语音的第二声纹特征; 计算所述第一声纹特征和所述第二声纹特征的声纹比对得分; 当所述声纹比对得分高于或等于得分阈值,则声纹比对的结果为匹配; 当所述声纹比对得分低于得分阈值,则声纹比对的结果为不匹配。 在一个实施例中,所述调整所述语音特征变换模型中参数的参数值包括: 确定对所述语音特征变换模型中参数的参数值进行调整的目标区间; 在所述目标区间内查找使得所述还原语音与所述原始语音之间的声纹比对得分趋高 的目标参数值; 将所述目标参数值确定为所述语音特征变换模型中的对应的所述参数的调整的参数 值。 在一个实施例中,所述确定对所述语音特征变换模型中参数的参数值进行调整的 目标区间,包括: 获取对所述参数的参数值进行调整的区间长度; 以所述语音特征变换模型中的所述参数当前的参数值为中心,并按照所述区间长度确 定所述参数对应的目标区间。 在一个实施例中,所述获取所述原始语音的第一声纹特征和所述还原语音的第二 声纹特征包括: 提取所述原始语音的帧级特征,并对所述原始语音的帧级特征进行运算得到所述原始 语音的句子级特征; 根据所述原始语音的帧级特征和句子级特征得到所述第一声纹特征; 提取所述还原语音的帧级特征,并对所述还原语音的帧级特征进行运算得到所述还原 语音的句子级特征; 根据所述还原语音的帧级特征和句子级特征得到所述第二声纹特征。 一种语音匹配装置,所述装置包括: 获取模块,用于获取待匹配的变声语音; 还原模块,用于通过语音特征变换模型还原所述变声语音,得到还原语音; 声纹比对模块,用于将嫌疑人的原始语音与所述还原语音进行声纹比对; 调整模块,当声纹比对的结果为不匹配时,用于调整所述语音特征变换模型中参数的 参数值,并返回所述通过语音特征变换模型还原所述变声语音的步骤进行迭代,直至声纹 比对的结果为匹配时停止迭代或者直至满足迭代停止条件时停止迭代; 确定模块,用于根据停止迭代时声纹比对的结果,确定所述变声语音和所述原始语音 的匹配结果。 在一个实施例中,所述装置还包括: 所述确定模块,还用于确定语音特征变换模型的至少一种参数;所述至少一种参数表 征至少一种用于还原变声语音的语音特征; 选取模块,用于分别选取所述语音特征变换模型的参数的初始参数值; 建立模块,用于根据所述语音特征变换模型的参数和所述参数的初始参数值建立语音 特征变换模型。 5 CN 111739547 A 说 明 书 3/13 页 在一个实施例中,所述声纹比对模块还用于: 分别对嫌疑人的原始语音和所述还原语音进行高通滤波; 分别将已经过高通滤波的所述原始语音和所述还原语音进行分段处理; 将已经过分段处理的所述原始语音和所述还原语音进行声纹比对。 在一个实施例中,所述声纹比对模块还用于: 获取所述原始语音的第一声纹特征和所述还原语音的第二声纹特征; 计算所述第一声纹特征和所述第二声纹特征的声纹比对得分; 当所述声纹比对得分高于或等于得分阈值,则声纹比对的结果为匹配; 当所述声纹比对得分低于得分阈值,则声纹比对的结果为不匹配。 在一个实施例中,所述调整模块还用于: 确定对所述语音特征变换模型中参数的参数值进行调整的目标区间; 在所述目标区间内查找使得所述还原语音与所述原始语音之间的声纹比对得分趋高 的目标参数值; 将所述目标参数值确定为所述语音特征变换模型中的对应的所述参数的调整的参数 值。 在一个实施例中,所述确定模块还用于: 获取对所述参数的参数值进行调整的区间长度; 以所述语音特征变换模型中的参数当前的参数值为中心,并按照所述区间长度确定所 述参数对应的目标区间。 在一个实施例中,所述声纹比对模块还用于: 提取所述原始语音的帧级特征,并对所述原始语音的帧级特征进行运算得到所述原始 语音的句子级特征; 根据所述原始语音的帧级特征和句子级特征得到所述第一声纹特征; 提取所述还原语音的帧级特征,并对所述还原语音的帧级特征进行运算得到所述还原 语音的句子级特征; 根据所述还原语音的帧级特征和句子级特征得到所述第二声纹特征。 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在 于,所述处理器执行所述计算机程序时实现所述语音匹配方法的步骤。 一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序 被处理器执行时实现所述语音匹配方法的步骤。 上述实施例中,计算机设备通过语音特征变换模型对待匹配的变声语音进行还原 得到还原语音,并根据原始语音与还原语音的声纹比对的结果对语音特征变换模型中参数 的参数值进行自动调整,最终确定还原语言和原始语音的匹配结果。计算机设备在对变声 语音进行还原的过程中,通过自动调整语音特征变换模型中参数的参数值,能够快速的得 到与原始语音最接近的还原语音,并根据与原始语音最接近的还原语音得到匹配结果,提 高了语音匹配的效率。 附图说明 图1为一个实施例中语音匹配方法的流程示意图; 6 CN 111739547 A 说 明 书 4/13 页 图2为一个实施例中获得变声语音的流程示意图; 图3为一个实施例中获得声纹比对的结果的流程示意图; 图4为另一个实施例中获得声纹比对的结果的流程示意图; 图5为一个实施例中语音匹配装置的结构框图; 图6为另一个实施例中语音匹配装置的结构框图; 图7为一个实施例中计算机设备的内部结构图; 图8为另一个实施例中计算机设备的内部结构图。
下载此资料需消耗2积分,
分享到:
收藏