logo好方法网

视频会议期间控制音频信号聚焦说话者


技术摘要:
一种非暂时性计算机可读存储介质可以包括其上存储的指令。当所述指令由至少一个处理器执行时,所述指令可以被配置为使得计算系统确定视频系统正在瞄准多个人中的单个说话者,从多个麦克风接收音频信号,接收到的所述音频信号包括由所述单个说话者生成的音频信号,基于  全部
背景技术:
在视频会议期间,一次可以单个人说话。摄像机可以瞄准和/或聚焦正在说话的单 个人。在视频会议的接收端的人可以将源自说话者以外的源的噪声感知为源自与说话者相 同的方向,这可能被感知为是不自然的。
技术实现要素:
根据示例,一种非暂时性计算机可读存储介质可以包括其上存储的指令。当所述 指令由至少一个处理器执行时,所述指令可以被配置为使得计算系统确定视频系统正在瞄 准多个人中的单个说话者,从多个麦克风接收音频信号,接收到的所述音频信号包括由所 述单个说话者生成的音频信号,基于确定所述视频系统正在瞄准所述单个说话者,传送单 声道信号,所述单声道信号是基于接收到的所述音频信号,确定所述视频系统没有正在瞄 准所述单个说话者,以及基于确定所述视频系统没有正在瞄准所述单个说话者,传送立体 声信号,所述立体声信号是基于接收到的所述音频信号。 根据示例,一种非暂时性计算机可读存储介质可以包括其上存储的指令。当所述 指令由至少一个处理器执行时,所述指令可以被配置为使得计算系统确定视频系统正在瞄 准的说话者的第一方向,从多个麦克风接收音频信号,基于接收到的所述音频信号,生成第 一音频信号并且聚焦所述第一方向,确定所述说话者以外的噪声源的第二方向,基于接收 到的所述音频信号,生成第二音频信号并且聚焦所述第二方向,以及基于所述第一音频信 号和所述第二音频信号,生成立体声信号。 根据示例,一种方法可以由计算系统进行。所述方法可以包括,确定视频系统正在 瞄准单个说话者,从麦克风阵列确定所述单个说话者的第一方向,基于确定所述视频系统 正在瞄准所述单个说话者和所述单个说话者的所述第一方向,基于在所述第一方向上对由 所述麦克风阵列接收到的多个第一方向音频信号进行波束形成来生成第一波束形成信号, 确定所述单个说话者以外的噪声源的第二方向,基于在所述第二方向上对由所述麦克风阵 列在所述第二方向上接收到的多个第二方向音频信号进行波束形成来生成第二波束形成 信号,基于所述第一波束形成信号和所述第二波束形成信号来生成单声道信号,所述第一 波束形成信号相对于所述第二波束形成信号具有更大的权重,确定所述视频系统没有正在 瞄准所述单个说话者,以及基于确定所述视频系统没有正在瞄准所述单个说话者,生成立 体声信号,所述立体声信号包括作为不同信号的所述第一波束形成信号和所述第二波束形 成信号。 在附图和下面的描述中阐述了一个或多个实施方式的细节。根据描述和附图,以 6 CN 111602414 A 说 明 书 2/20 页 及根据权利要求书,其它特征将是显而易见的。 附图说明 图1是根据示例的视频会议系统的图。 图2是根据示例的可以实施视频会议系统的特征的计算系统的框图。 图3是示出根据示例的在视频会议系统从其接收输入的位置内的波束形成的方向 的图。 图4A是示出根据示例的当摄像机正在聚焦单个人时波束形成信号的权重的图。 图4B是示出根据示例的当摄像机已经缩小并且正在瞄准和/或聚焦多个人时波束 形成信号的权重的图。 图4C是示出根据另一示例的当摄像机正在瞄准和/或聚焦单个人并且视频会议系 统正在对单个人和多个噪声源进行波束形成时波束形成信号的权重的图。 图5是示出根据示例的麦克风和朝向不同的音频信号源的波束形成的方向的图。 图6是示出根据示例的麦克风和沿着波束形成的方向的麦克风之间的数个波长的 图。 图7是示出根据示例的方法的流程图。 图8是示出根据另一示例的方法的流程图。 图9是示出根据另一示例的方法的流程图。 图10示出了可以用于实施本文描述的技术的计算机设备和移动计算机设备的示 例。
分享到:
收藏