logo好方法网

语音会话的编码码率控制方法、装置和计算机设备


技术摘要:
本申请涉及一种语音会话的编码码率控制方法、装置、计算机设备和存储介质。该方法包括:获取语音会话的各语音通道中当前音频帧的音频信号;根据各音频信号,分别生成在当前音频帧各语音通道的混音信号;对于各语音通道中的每一目标语音通道,确定在当前音频帧目标语音  全部
背景技术:
随着计算机技术的发展,线上多人语音通话越来越普遍,例如多人语音聊天、多人 音视频会员等。实现线上多人语音通话,通常为各个会话方通过不同的终端进行音频信号 采集,然后对采集到的音频信号进行语音编码得到语音编码数据,并将语音编码数据通过 网络发送到混音设备,混音设备将语音编码数据解码后进行音频信号的混合叠加处理,最 后各个会话方的终端根据相应的混音结果信号进行声音播放。其中,各个会话方对应终端 发送采集到的音频信号至混音设备的过程,需要消耗网络带宽资源,特别是会话方数量较 多的大型语音会议,网络带宽资源的消耗量巨大。
技术实现要素:
基于此,有必要针对上述技术问题,提供一种语音会话的语音编码码率控制方法、 装置、计算机设备和存储介质。 一种语音会话的编码码率控制方法,所述方法包括: 获取语音会话的各语音通道中当前音频帧的音频信号; 根据各所述音频信号,分别生成在当前音频帧各语音通道的混音信号; 对于各语音通道中的每一目标语音通道,确定在当前音频帧所述目标语音通道的 音频信号在其它所述语音通道的混音信号中的混音贡献占比; 根据所述混音贡献占比确定所述目标语音通道下一音频帧的编码码率;所述编码 码率与所述混音贡献占比正相关。 一种语音会话的编码码率控制装置,所述装置包括: 第一信号获取模块,用于获取语音会话的各语音通道中当前音频帧的音频信号; 混音信号获取模块,用于根据各所述音频信号,分别生成在当前音频帧各语音通 道的混音信号; 混音占比获取模块,用于对于各语音通道中的每一目标语音通道,确定在当前音 频帧所述目标语音通道的音频信号在其它所述语音通道的混音信号中的混音贡献占比; 第一编码码率确定模块,用于根据所述混音贡献占比确定所述目标语音通道下一 音频帧的编码码率;所述编码码率与所述混音贡献占比正相关。 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理 器执行所述计算机程序时实现以下步骤: 获取语音会话的各语音通道中当前音频帧的音频信号; 根据各所述音频信号,分别生成在当前音频帧各语音通道的混音信号; 对于各语音通道中的每一目标语音通道,确定在当前音频帧所述目标语音通道的 6 CN 111583942 A 说 明 书 2/20 页 音频信号在其它所述语音通道的混音信号中的混音贡献占比; 根据所述混音贡献占比确定所述目标语音通道下一音频帧的编码码率;所述编码 码率与所述混音贡献占比正相关。 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执 行时实现以下步骤: 获取语音会话的各语音通道中当前音频帧的音频信号; 根据各所述音频信号,分别生成在当前音频帧各语音通道的混音信号; 对于各语音通道中的每一目标语音通道,确定在当前音频帧所述目标语音通道的 音频信号在其它所述语音通道的混音信号中的混音贡献占比; 根据所述混音贡献占比确定所述目标语音通道下一音频帧的编码码率;所述编码 码率与所述混音贡献占比正相关。 上述语音会话的编码码率控制方法、装置、计算机设备和存储介质,通过获取语音 会话的各语音通道中当前音频帧的音频信号;根据各音频信号,分别生成在当前音频帧各 语音通道的混音信号;对于各语音通道中的每一目标语音通道,确定在当前音频帧目标语 音通道的音频信号在其它语音通道的混音信号中的混音贡献占比;根据混音贡献占比确定 目标语音通道下一音频帧的编码码率;编码码率与混音贡献占比正相关,后续根据编码码 率指示目标语音通道对应的终端,使得终端按照编码码率对采集的下一音频帧进行编码, 实现控制各个语音通道的音频信号的编码码率,对在混音信号中参与度较低的语音通道的 音频信号设置较低的编码码率,避免混音参与度较低的语音通道的音频信号的传输消耗过 多的网络带宽资源。 一种语音会话的语音编码码率控制方法,所述方法包括: 获取语音会话的各语音通道中当前音频帧的音频信号的语音特征值; 根据在当前音频帧各所述语音通道对应的语音特征值,确定各所述语音通道的混 音选入概率值;所述混音选入概率值用于反映语音通道的音频信号被选中进行混音处理的 概率; 对于各语音通道中的每一目标语音通道,根据在当前音频帧所述目标语音通道的 混音选入概率值,确定所述目标语音通道下一音频帧的编码码率,所述编码码率与所述混 音选入概率值正相关。 一种语音会话的编码码率控制装置,所述装置包括: 第二信号获取模块,用于获取语音会话的各语音通道中当前音频帧的音频信号的 语音特征值; 选路状态获取模块,用于根据在当前音频帧各所述语音通道对应的语音特征值, 确定各所述语音通道的混音选入概率值;所述混音选入概率值用于反映语音通道的音频信 号被选中进行混音处理的概率; 第二编码码率获取模块,用于对于各语音通道中的每一目标语音通道,根据在当 前音频帧所述目标语音通道的混音选入概率值,确定所述目标语音通道下一音频帧的编码 码率,所述编码码率与所述混音选入概率值正相关。 一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理 器执行所述计算机程序时实现以下步骤: 7 CN 111583942 A 说 明 书 3/20 页 获取语音会话的各语音通道中当前音频帧的音频信号; 根据各所述音频信号,分别生成在当前音频帧各语音通道的混音信号; 对于各语音通道中的每一目标语音通道,确定在当前音频帧所述目标语音通道的 音频信号在其它所述语音通道的混音信号中的混音贡献占比; 根据所述混音贡献占比确定所述目标语音通道下一音频帧的编码码率;所述编码 码率与所述混音贡献占比正相关。 一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执 行时实现以下步骤: 获取语音会话的各语音通道中当前音频帧的音频信号的语音特征值; 根据在当前音频帧各所述语音通道对应的语音特征值,确定各所述语音通道的混 音选入概率值;所述混音选入概率值用于反映语音通道的音频信号被选中进行混音处理的 概率; 对于各语音通道中的每一目标语音通道,根据在当前音频帧所述目标语音通道的 混音选入概率值,确定所述目标语音通道下一音频帧的编码码率,所述编码码率与所述混 音选入概率值正相关。 上述语音会话的编码码率控制方法、装置、计算机设备和存储介质,通过获取语音 会话的各语音通道中当前音频帧的音频信号;根据各音频信号,分别生成在当前音频帧各 语音通道的混音信号;对于各语音通道中的每一目标语音通道,确定在当前音频帧目标语 音通道的音频信号在其它语音通道的混音信号中的混音贡献占比;根据混音贡献占比确定 目标语音通道下一音频帧的编码码率;编码码率与混音贡献占比正相关,后续根据编码码 率指示目标语音通道对应的终端,使得终端按照编码码率对采集的下一音频帧进行编码, 实现控制各个语音通道的音频信号的编码码率,对混音选入概率值较低的语音通道的音频 信号设置较低的编码码率,避免混音参与度较低的语音通道的音频信号的传输消耗过多的 网络带宽资源。 附图说明 图1为一个实施例中语音会话的编码码率控制方法的应用环境图; 图2为一个实施例中语音会话的编码码率控制方法的流程示意图; 图3为一个实施例中确定在当前音频帧目标语音通道的音频信号在其它语音通道 的混音信号中的混音贡献占比步骤的流程示意图; 图4为另一个实施例中根据贡献信号总量以及混音信号总量,获取在当前音频帧 目标语音通道的音频信号在其它语音通道的混音信号中的混音贡献占比步骤的流程示意 图; 图5为一个实施例中语音会话的编码码率控制方法的流程示意图; 图6为一个实施例中根据在当前音频帧目标语音通道的混音选入概率值,确定目 标语音通道下一音频帧的编码码率步骤的流程示意图; 图7为另一个实施例中根据在当前音频帧目标语音通道的混音选入概率值,确定 目标语音通道下一音频帧的编码码率步骤的流程示意图; 图8a为另一个实施例中语音会话的编码码率控制方法的应用环境图; 8 CN 111583942 A 说 明 书 4/20 页 图8b为一个实施例中终端与服务器交互的时序图; 图8c为一个实施例中语音会话的编码码率控制方法的流程图; 图8d为另一个实施例中终端与服务器交互的时序图; 图8e为另一个实施例中语音会话的编码码率控制方法的流程图; 图9为一个实施例中语音会话的编码码率控制装置的结构框图; 图10为另一个实施例中语音会话的编码码率控制装置的结构框图; 图11为一个实施例中计算机设备的内部结构图。
分享到:
收藏