logo好方法网

音频匹配方法,电子设备及存储介质


技术摘要:
本申请公开了一种音频匹配方法,电子设备及存储介质。该方法包括:获取待处理音频;按照划分方式将待处理音频划分为多个第一音频帧,其中相邻两个第一音频帧部分重叠;对每个第一音频帧进行傅里叶变换得到每个第一音频帧的频谱;基于第一音频帧的频谱,得到待处理音频  全部
背景技术:
近年来,互联网音视频数据海量增加,音视频数据相比于其他形式的数据具有信 息传播速度快、用户创造内容等特点。这些音视频数据在给我们的生活带来极大便利的同 时也伴随着网络犯罪等情况的发生。现有技术中,一般采用自动匹配方法来从海量的音视 频数据中获取如涉网犯罪的信息。然而,现有的自动匹配方法得到的结果不够准确。
技术实现要素:
本申请提供一种音频匹配方法,电子设备及存储介质,能够解决现有的自动匹配 方法得到的结果不够准确的问题。 为解决上述技术问题,本申请采用的一个技术方案是:提供一种音频匹配方法,该 方法包括:获取待处理音频;按照划分方式将待处理音频划分为多个第一音频帧,其中相邻 两个第一音频帧部分重叠;对每个第一音频帧进行傅里叶变换得到每个第一音频帧的频 谱;基于第一音频帧的频谱,得到待处理音频的多个频谱峰值特征指纹;将待处理音频的多 个频谱峰值特征指纹与数据库音频的多个频谱峰值特征指纹进行动态滑窗匹配检索,得到 待处理音频的匹配结果。 为解决上述技术问题,本申请采用的另一个技术方案是:提供一种电子设备,该电 子设备包括处理器、与处理器连接的存储器,该存储器存储有程序指令;处理器用于执行存 储器存储的所述程序指令以实现上述方法。 为解决上述技术问题,本申请采用的再一个技术方案是:提供一种存储介质,存储 有程序指令,该程序指令被执行时能够实现上述方法。 本申请的有益效果是:本申请将待处理音频划分为多个第一音频帧,其中相邻的 第一音频帧部分重叠,与传统的不重叠的划分方式相比,得到的第一音频帧数量更多,对应 的频谱峰值特征指纹更多,即使在待处理音频的时长较短的情况下,也可以得到更加准确 的匹配结果。 附图说明 图1是本申请音频匹配方法一实施例的流程示意图; 图2是图1中S120的具体流程示意图; 图3是图1中S140的具体流程示意图; 图4是图3中S141的具体流程示意图; 图5是本申请音频匹配方法一实施例中组合哈希键值示意图; 图6是图1中S150的具体流程示意图; 图7是图1中S160的具体流程示意图; 4 CN 111599378 A 说 明 书 2/8 页 图8是图7中S161的具体流程示意图; 图9是现有的滑窗方法示意图; 图10是本申请音频匹配方法一实施例中滑窗方法示意图; 图11是图8中S1613的具体流程示意图; 图12是本申请音频匹配方法一实施例中散列表示意图; 图13是图7中S162的具体流程示意图; 图14是本申请电子设备一实施例的结构示意图; 图15是本申请存储介质一实施例的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏