logo好方法网

音频处理方法、装置、设备及存储介质


技术摘要:
本申请公开了一种音频处理方法、装置、设备及存储介质,属于音频技术领域。该方法包括:获取待处理的双声道音频信号,双声道音频信号包括左声道信号和右声道信号;根据左声道信号和右声道信号,确定单通道频域信号;根据左声道信号和右声道信号,确定声场信息;根据声  全部
背景技术:
多通道环绕声系统广泛应用于影视、广播等领域,然而,有很多音频是由双声道立 体声系统制作的,为了获得更好的听觉效果,往往会将音频从双声道音频信号转换为多通 道音频信号。 目前,可以利用变换矩阵,将双声道音频信号转换为多通道音频信号。譬如,可以 将双声道音频信号转换为信号矩阵,对该信号矩阵进行转换得到多通道音频信号。 然而,在多通道音频信号的通道数量确定的情况下,不同的双声道音频信号都是 与同一个变换矩阵相乘,得到不同的多通道音频信号的。在该种情况下,可能会导致转换得 到的多通道音频信号中各个通道的音频信号之间相关性较高。
技术实现要素:
本申请实施例提供了一种音频处理方法、装置、设备及存储介质,可以解决相关技 术中各个通道的音频信号之间的相关性较高的问题。所述技术方案如下: 一方面,提供了一种音频处理方法,所述方法包括: 获取待处理的双声道音频信号,所述双声道音频信号包括左声道信号和右声道信 号; 根据所述左声道信号和所述右声道信号,确定单通道频域信号; 根据所述左声道信号和所述右声道信号,确定声场信息,所述声场信息用于指示 双耳接收信号的差异; 根据所述声场信息,确定所述单通道频域信号中的频点的方向信息; 对所述单通道频域信号中的频点的方向信息进行归类,得到多个通道的掩码序 列,一个掩码序列与一个通道对应,每个掩码序列用于指示对应的通道包括所述单通道频 域信号中的多个频点对应的频域信号情况; 根据所述多个通道的掩码序列和所述单通道频域信号,确定所述双声道音频信号 对应的多通道音频信号。 在本申请一种可能的实现方式中,所述多个通道中的每个通道对应有参考方向信 息和方向信息偏差阈值;所述单通道频域信号中的频点的数量为多个; 所述对所述单通道频域信号中的频点的方向信息进行归类,得到多个通道的掩码 序列,包括: 对于多个通道中的任一通道,确定所述多个频点中每个频点的方向信息与所述任 一通道对应的参考方向信息之间的差值的绝对值,得到每个频点与所述任一通道的方向信 息偏差; 根据每个频点与所述任一通道的方向信息偏差、以及所述任一通道的方向信息偏 6 CN 111615045 A 说 明 书 2/14 页 差阈值,确定所述任一通道对应的掩码序列中每个频点对应的掩码值。 在本申请一种可能的实现方式中,所述根据每个频点与所述任一通道的方向信息 偏差、以及所述任一通道的方向信息偏差阈值,确定所述任一通道对应的掩码序列中每个 频点对应的掩码值,包括: 对于所述多个频点中的任一频点,若所述任一频点与所述任一通道的方向信息偏 差小于所述任一通道对应的方向信息偏差阈值,则确定所述任一通道对应的掩码序列中所 述任一频点对应的掩码值为第一数值,所述第一数值用于指示所述任一频点对应的频域信 号属于所述任一通道; 若所述任一频点与所述任一通道的方向信息偏差大于所述任一通道的方向信息 偏差阈值,则确定所述任一通道对应的掩码序列中所述任一频点对应的掩码值为第二数 值,所述第二数值用于指示所述任一频点对应的频域信号不属于所述任一通道。 在本申请一种可能的实现方式中,所述根据所述多个通道的掩码序列和所述单通 道频域信号,确定所述双声道音频信号对应的多通道音频信号,包括: 将每个通道对应的掩码序列与所述单通道频域信号相乘,得到每个通道的频域信 号; 对每个通道的频域信号进行傅里叶逆变换,得到每个通道的时域信号; 将所述多个通道的时域信号确定为所述多通道音频信号。 在本申请一种可能的实现方式中,所述根据所述左声道信号和所述右声道信号, 确定声场信息,包括: 确定所述左声道信号对应的左声道频域信号,以及确定所述右声道信号对应的右 声道频域信号; 根据所述左声道频域信号和所述右声道频域信号,确定所述双耳强度差; 根据所述左声道频域信号和所述右声道频域信号,确定所述双耳相位差; 将所述双耳强度差和所述双耳相位差确定为所述声场信息。 在本申请一种可能的实现方式中,所述根据所述左声道频域信号和所述右声道频 域信号,确定所述双耳强度差,包括: 分别确定所述左声道频域信号的绝对值和所述右声道频域信号的绝对值; 确定所述左声道频域信号的绝对值与所述右声道频域信号的绝对值的差值,得到 第三数值; 确定所述左声道频域信号的绝对值与所述右声道频域信号的绝对值之和,得到第 四数值; 将所述第三数值与所述第四数值相除,得到所述双耳强度差。 在本申请一种可能的实现方式中,所述根据所述左声道频域信号和所述右声道频 域信号,确定所述双耳相位差,包括: 分别确定所述左声道频域信号的角频率和所述右声道频域信号的角频率; 根据所述左声道频域信号的角频率和所述右声道频域信号的角频率的角频率差 值,确定所述双耳相位差。 在本申请一种可能的实现方式中,所述根据所述左声道信号和所述右声道信号, 确定单通道频域信号,包括: 7 CN 111615045 A 说 明 书 3/14 页 确定所述左声道信号对应的左声道频域信号,以及确定所述右声道信号对应的右 声道频域信号; 根据所述左声道频域信号和所述右声道频域信号,确定所述单通道频域信号的幅 值; 根据所述左声道频域信号和所述右声道频域信号,确定所述单通道频域信号的角 频率; 根据所述单通道频域信号的幅值和角频率,确定所述单通道频域信号。 另一方面,提供了一种音频处理装置,所述装置包括: 获取模块,用于获取待处理的双声道音频信号,所述双声道音频信号包括左声道 信号和右声道信号; 第一确定模块,用于根据所述左声道信号和所述右声道信号,确定单通道频域信 号; 第二确定模块,用于根据所述左声道信号和所述右声道信号,确定声场信息,所述 声场信息用于指示双耳接收信号的差异; 第三确定模块,用于根据所述声场信息,确定所述单通道频域信号中的频点的方 向信息; 归类模块,用于对所述单通道频域信号中的频点的方向信息进行归类,得到多个 通道的掩码序列,一个掩码序列与一个通道对应,每个掩码序列用于指示对应的通道包括 所述单通道频域信号中的多个频点对应的频域信号情况; 第四确定模块,用于根据所述多个通道的掩码序列和所述单通道频域信号,确定 所述双声道音频信号对应的多通道音频信号。 在本申请一种可能的实现方式中,所述多个通道中的每个通道对应有参考方向信 息和方向信息偏差阈值;所述单通道频域信号中的频点的数量为多个; 所述归类模块用于: 对于多个通道中的任一通道,确定所述多个频点中每个频点的方向信息与所述任 一通道对应的参考方向信息之间的差值的绝对值,得到每个频点与所述任一通道的方向信 息偏差; 根据每个频点与所述任一通道的方向信息偏差、以及所述任一通道的方向信息偏 差阈值,确定所述任一通道对应的掩码序列中每个频点对应的掩码值。 在本申请一种可能的实现方式中,所述归类模块用于: 对于所述多个频点中的任一频点,若所述任一频点与所述任一通道的方向信息偏 差小于所述任一通道对应的方向信息偏差阈值,则确定所述任一通道对应的掩码序列中所 述任一频点对应的掩码值为第一数值,所述第一数值用于指示所述任一频点对应的频域信 号属于所述任一通道; 若所述任一频点与所述任一通道的方向信息偏差大于所述任一通道的方向信息 偏差阈值,则确定所述任一通道对应的掩码序列中所述任一频点对应的掩码值为第二数 值,所述第二数值用于指示所述任一频点对应的频域信号不属于所述任一通道。 在本申请一种可能的实现方式中,所述第四确定模块用于: 将每个通道对应的掩码序列与所述单通道频域信号相乘,得到每个通道的频域信 8 CN 111615045 A 说 明 书 4/14 页 号; 对每个通道的频域信号进行傅里叶逆变换,得到每个通道的时域信号; 将所述多个通道的时域信号确定为所述多通道音频信号。 在本申请一种可能的实现方式中,所述第二确定模块用于: 确定所述左声道信号对应的左声道频域信号,以及确定所述右声道信号对应的右 声道频域信号; 根据所述左声道频域信号和所述右声道频域信号,确定所述双耳强度差; 根据所述左声道频域信号和所述右声道频域信号,确定所述双耳相位差; 将所述双耳强度差和所述双耳相位差确定为所述声场信息。 在本申请一种可能的实现方式中,所述第三确定模块用于: 分别确定所述左声道频域信号的绝对值和所述右声道频域信号的绝对值; 确定所述左声道频域信号的绝对值与所述右声道频域信号的绝对值的差值,得到 第三数值; 确定所述左声道频域信号的绝对值与所述右声道频域信号的绝对值之和,得到第 四数值; 将所述第三数值与所述第四数值相除,得到所述双耳强度差。 在本申请一种可能的实现方式中,所述第三确定模块用于: 分别确定所述左声道频域信号的角频率和所述右声道频域信号的角频率; 根据所述左声道频域信号的角频率和所述右声道频域信号的角频率的角频率差 值,确定所述双耳相位差。 在本申请一种可能的实现方式中,所述第一确定模块用于: 确定所述左声道信号对应的左声道频域信号,以及确定所述右声道信号对应的右 声道频域信号; 根据所述左声道频域信号和所述右声道频域信号,确定所述单通道频域信号的幅 值; 根据所述左声道频域信号和所述右声道频域信号,确定所述单通道频域信号的角 频率; 根据所述单通道频域信号的幅值和角频率,确定所述单通道频域信号。 另一方面,提供了一种电子设备,包括: 处理器; 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为实现上述一方面所述的音频处理方法。 另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有 指令,所述指令被处理器执行时实现上述一方面所述的音频处理方法。 另一方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得 计算机执行上述一方面所述的音频处理方法。 本申请实施例提供的技术方案带来的有益效果是: 分别基于待处理的双声道音频信号,确定单通道频域信号和声场信息,其中,单通 道频域信号是用于生成每个通道的频域信号的基准信号,该声场信息可以用于指示双耳接 9 CN 111615045 A 说 明 书 5/14 页 收信号的差异。根据声场信息,确定单通道频域信号中每个频点的方向信息。进而,可以单 通道频域信号中的频点的方向信息,确定多个通道的掩码序列,该掩码序列可以用于指示 对应的通道包括单频道频域信号中哪些频点对应的频域信号,从而根据该多个通道的掩码 序列,将该单通道频域信号的频点分配至对应的通道中,从而使得同一通道包括的频点的 方向信息之间的差距较小,不同通道包括的频点的方向信息之间的差距较大,减小了不同 通道的频域信号之间的相关性。 附图说明 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1是根据一示例性实施例示出的一种音频处理方法的流程图; 图2是根据一示例性实施例示出的一种音频处理的示意图; 图3是根据一示例性实施例示出的一种音频处理装置的结构示意图; 图4是根据一示例性实施例示出的一种电子设备的结构示意图。
分享到:
收藏