技术摘要:
本公开涉及音频拼接方法、装置及存储介质。该方法包括:确定各个待拼接音频的音频片段;对于各个待拼接音频中的第一待拼接音频的第一音频片段和第二待拼接音频的第二音频片段,根据第一音频片段的相邻音频片段和第二音频片段的相邻音频片段中的至少一项,确定第一音频 全部
背景技术:
目前,音频拼接作品(例如串烧歌曲)多为人工创作,这要求创作者对音乐具有较 高的敏感度,且通常需要耗费大量的人力和时间。如何自动化地进行音频拼接以得到和谐 的音频拼接作品,是亟待解决的问题。
技术实现要素:
有鉴于此,本公开提出了一种音频拼接方法、装置及存储介质。 根据本公开的一方面,提供了一种音频拼接方法,包括: 确定各个待拼接音频的音频片段; 对于所述各个待拼接音频中的第一待拼接音频的第一音频片段和第二待拼接音 频的第二音频片段,根据所述第一音频片段的相邻音频片段和所述第二音频片段的相邻音 频片段中的至少一项,确定所述第一音频片段与所述第二音频片段之间的和谐度,其中,所 述第一音频片段包括所述第一待拼接音频的任意一个音频片段,所述第二音频片段包括所 述第二待拼接音频的任意一个音频片段; 根据所述各个待拼接音频中的每两个待拼接音频的音频片段之间的和谐度,确定 所述每两个待拼接音频之间的匹配的音频片段; 根据所述每两个待拼接音频之间的匹配的音频片段,对所述各个待拼接音频的音 频片段进行拼接。 在一种可能的实现方式中,确定所述第一音频片段的相邻音频片段与所述第二音 频片段之间的相似度; 确定所述第一音频片段与所述第二音频片段的相邻音频片段之间的相似度; 根据所述第一音频片段的相邻音频片段与所述第二音频片段之间的相似度,以及 所述第一音频片段与所述第二音频片段的相邻音频片段之间的相似度,确定所述第一音频 片段与所述第二音频片段之间的和谐度。 在一种可能的实现方式中,根据所述第一音频片段的相邻音频片段和所述第二音 频片段的音高、节奏和响度中的至少一项,确定所述第一音频片段的相邻音频片段与所述 第二音频片段之间的相似度; 根据所述第一音频片段和所述第二音频片段的相邻音频片段的音高、节奏和响度 中的至少一项,确定所述第一音频片段与所述第二音频片段的相邻音频片段之间的相似 度。 在一种可能的实现方式中,所述第一音频片段的相邻音频片段为所述第一音频片 段的下一音频片段,所述第二音频片段的相邻音频片段为所述第二音频片段的上一音频片 段。 4 CN 111613195 A 说 明 书 2/16 页 在一种可能的实现方式中,若所述第一音频片段与所述第二音频片段之间的和谐 度大于和谐度阈值,且在所述第一待拼接音频的各个音频片段与所述第二待拼接音频的各 个音频片段中,所述第一音频片段与所述第二音频片段之间的和谐度最大,则将所述第一 音频片段与所述第二音频片段确定为所述第一待拼接音频与所述第二待拼接音频之间的 匹配的音频片段。 在一种可能的实现方式中,根据所述每两个待拼接音频之间的匹配的音频片段, 确定所述各个待拼接音频对应的最长拼接序列; 根据所述最长拼接序列,确定所述各个待拼接音频中的待拼接音频片段; 根据所述最长拼接序列对应的待拼接音频的顺序,对所述各个待拼接音频片段进 行拼接。 在一种可能的实现方式中,若所述第一音频片段与所述第二音频片段为所述第一 待拼接音频与所述第二待拼接音频之间的匹配的音频片段,第三音频片段与第四音频片段 为所述第二待拼接音频与第三待拼接音频之间的匹配的音频片段,且所述第二音频片段与 所述第三音频片段之间的片段数小于数量阈值,则确定所述第一待拼接音频、所述第二待 拼接音频与所述第三待拼接音频可拼接,其中,所述第三音频片段为所述第二待拼接音频 中在所述第二音频片段之后的任意一个音频片段,所述第四音频片段为所述第三待拼接音 频中的任意一个音频片段; 根据所述各个待拼接音频中的可拼接的待拼接音频,确定所述各个待拼接音频对 应的最长拼接序列。 在一种可能的实现方式中,所述各个待拼接音频中的任一待拼接音频在所述最长 拼接序列中最多出现一次。 在一种可能的实现方式中,在所述对所述各个待拼接音频片段进行拼接之后,还 包括: 确定所述各个待拼接片段的平均节奏和平均响度; 根据所述各个待拼接片段的平均节奏,对所述各个待拼接片段进行节奏调节; 根据所述各个待拼接片段的平均响度,对所述各个待拼接片段进行响度调节。 根据本公开的另一方面,提供了一种音频拼接装置,包括: 第一确定模块,用于确定各个待拼接音频的音频片段; 第二确定模块,用于对于所述各个待拼接音频中的第一待拼接音频的第一音频片 段和第二待拼接音频的第二音频片段,根据所述第一音频片段的相邻音频片段和所述第二 音频片段的相邻音频片段中的至少一项,确定所述第一音频片段与所述第二音频片段之间 的和谐度,其中,所述第一音频片段包括所述第一待拼接音频的任意一个音频片段,所述第 二音频片段包括所述第二待拼接音频的任意一个音频片段; 第三确定模块,用于根据所述各个待拼接音频中的每两个待拼接音频的音频片段 之间的和谐度,确定所述每两个待拼接音频之间的匹配的音频片段; 拼接模块,用于根据所述每两个待拼接音频之间的匹配的音频片段,对所述各个 待拼接音频的音频片段进行拼接。 根据本公开的另一方面,提供了一种音频拼接装置,包括:处理器;用于存储处理 器可执行指令的存储器;其中,所述处理器被配置为执行上述方法。 5 CN 111613195 A 说 明 书 3/16 页 根据本公开的另一方面,提供了一种非易失性计算机可读存储介质,其上存储有 计算机程序指令,其中,所述计算机程序指令被处理器执行时实现上述方法。 在本公开实施例中,通过确定各个待拼接音频的音频片段,对于各个待拼接音频 中的第一待拼接音频的第一音频片段和第二待拼接音频的第二音频片段,根据第一音频片 段的相邻音频片段和第二音频片段的相邻音频片段中的至少一项,确定第一音频片段与第 二音频片段之间的和谐度,根据各个待拼接音频中的每两个待拼接音频的音频片段之间的 和谐度,确定每两个待拼接音频之间的匹配的音频片段,并根据每两个待拼接音频之间的 匹配的音频片段,对各个待拼接音频的音频片段进行拼接,由此能够自动化地进行音频拼 接,并能够基于音频片段的上下文确定音频片段之间的和谐度,从而能够提高音频片段之 间的拼接自然程度,得到和谐的音频拼接作品。 根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得 清楚。 附图说明 包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的 示例性实施例、特征和方面,并且用于解释本公开的原理。 图1示出根据本公开一实施例的音频拼接方法的流程图。 图2示出根据本公开一实施例的音频拼接方法中谋一窗口对应的频谱图的示意 图。 图3示出根据本公开一实施例的音频拼接方法中第一音高曲线、第二音高曲线以 及第一音高曲线与第二音高曲线之间的面积的示意图。 图4示出根据本公开一实施例的音频拼接方法中确定歌曲A(第一待拼接音频)的 第一音频片段a的下一音频片段a 的前3秒与第二音频片段b的前3秒之间的相似度,以及确 定第一音频片段a的后3秒与第二音频片段b的上一音频片段b-的后3秒之间的相似度的示 意图。 图5示出根据本公开一实施例的音频拼接方法中基于表2得到的有向图的示意图。 图6示出根据本公开一实施例的音频拼接装置的框图。 图7是根据一示例性实施例示出的一种用于音频拼接的装置800的框图。 图8是根据一示例性实施例示出的一种用于音频拼接的装置1900的框图。