logo好方法网

音频数据处理方法、装置、设备及计算机存储介质


技术摘要:
本申请公开了一种音频数据处理方法、装置、设备及计算机存储介质,属于音频数据分析技术领域。所述方法包括:获取音频数据的至少两种音频特征,所述至少两种音频特征与至少两个判别模型一一对应,每个所述判别模型用于根据对应的音频特征输出用户特征;将每个所述音频  全部
背景技术:
服务器可以根据用户的音频数据获取用户特征,以便服务器根据用户特征为用户 匹配(或推荐)其他用户,用户特征可以包括用户性别信息以及情绪类型中的至少一种。 相关技术中的一种音频数据处理方法中,服务器将用户的音频数据输入判别模型 中,该判别模型即可输出用户的性别信息与情绪类型。 但是,这种音频数据处理方法得到的用户的性别信息与情绪类型为单一的结果, 可选择性较低,导致这种音频数据处理方法准确性较低。
技术实现要素:
本申请实施例提供了一种音频数据处理方法、装置、设备及计算机存储介质。所述 技术方案如下: 根据本申请的第一方面,提供了一种音频数据处理方法,所述音频数据处理方法 包括: 获取音频数据的至少两种音频特征,所述至少两种音频特征与至少两个判别模型 一一对应,每个所述判别模型用于根据对应的音频特征输出用户特征; 将每个所述音频特征输入对应的判别模型,得到所述至少两种音频特征对应的至 少两个用户特征; 根据所述至少两个用户特征确定所述音频数据对应的目标用户特征。 可选的,所述获取音频数据的至少两种音频特征之前,所述方法还包括: 获取训练音频数据以及所述训练音频数据对应的用户特征; 获取所述训练音频数据的至少两种音频特征; 根据所述训练音频数据的至少两种音频特征以及所述用户该特征分别训练至少 两个初始判别模型,得到所述至少两个判别模型。 可选的,每个所述用户特征包括至少一类子特征,所述用户特征的数量为至少三 个, 所述根据所述至少两个用户特征确定所述音频数据对应的目标用户特征,包括: 将至少三个所述用户特征中,每一类子特征中出现次数最多的子特征确定为所述 目标用户特征中的子特征。 可选的,所述获取音频数据的至少两种音频特征之前,所述方法还包括: 获取原始音频数据; 对所述原始音频数据进行预处理,得到所述音频数据,所述预处理包括重采样,预 加重以及去除所述初始音频信号中的静音部分中的至少一种。 4 CN 111599381 A 说 明 书 2/8 页 可选的,所述用户特征中的子特征包括性别信息和情绪类型中的至少一种。 可选的,所述判别模型包括深度学习神经网络模型,高斯混合模型,隐马尔可夫模 型以及主成分分析模型中的至少一种。 可选的,所述音频特征包括: 基频特征,共振峰,频谱包络特征以及声压级特征中的至少两种。 另一方面,提供了一种音频数据处理装置,所述音频数据处理装置包括: 获取模块,用于获取音频数据的至少两种音频特征,所述至少两种音频特征与至 少两个判别模型一一对应,每个所述判别模型用于根据对应的音频特征输出用户特征; 输入模块,用于将每个所述音频特征输入对应的判别模型,得到所述至少两种音 频特征对应的至少两个用户特征; 确定模块,用于根据所述至少两个用户特征确定所述音频数据对应的目标用户特 征。 又一方面,提供了一种音频数据处理设备,所述音频数据处理设备包括处理器和 存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一 条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如第一 方面所述的音频数据处理方法。 再一方面,提供了一种计算机存储介质,所述计算机存储介质中存储有至少一条 指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集 或指令集由处理器加载并执行以实现如第一方面所述的音频数据处理方法。 本申请实施例提供的技术方案带来的有益效果至少包括: 提供了一种音频数据处理方法,该音频数据处理方法通过将音频数据的至少两种 音频特征输入对应的判别模型,可以得到与每种音频特征对应的用户特征,如此便能根据 至少两种音频特征确定音频数据对应的目标用户特征。上述技术方案,解决了相关技术中 音频数据处理方法准确性较低的问题。达到了提高音频数据处理方法准确性的效果。 附图说明 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1是本申请实施例提供的音频数据处理方法的实施环境的示意图; 图2是本申请实施例提供的一种音频数据处理方法的流程图; 图3是本申请实施例提供的另一种音频数据处理方法的流程图; 图4是本申请实施例提供的一种根据训练音频数据得到至少两个判别模型的流程 图; 图5是本申请实施例提供的一种根据音频数据得到目标用户特征的流程图; 图6是本申请实施例提供的一种音频数据处理装置的框图; 图7是本申请实施例提供的一种音频数据处理装置的结构示意图。 通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图 5 CN 111599381 A 说 明 书 3/8 页 和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为 本领域技术人员说明本申请的概念。
下载此资料需消耗2积分,
分享到:
收藏