logo好方法网

音频信号的处理方法、装置、安防摄像头及存储介质


技术摘要:
本发明涉及通信技术领域,公开了音频信号的处理方法、装置、安防摄像头及存储介质,该方法包括:将接收到的音频帧依次插入第一数组;当第一数组的音频帧的数量达到数量阈值时,根据第二数组,判断第一数组的音频帧的每一频点对应的处理数值是否为零;第二数组包含与每  全部
背景技术:
随着物联网进程加快,作为家庭安防设备的安防摄像头正走进千家万户,并在我 们的生活中扮演越来越重要的角色;而且,随着科学技术的发展,安防摄像头也越来越智 能,它不仅仅是一个监控工具,还有手机查看、实时对讲、视频回放、移动侦测等功能。 目前,现有的安防摄像头可以将监控到的音频与画面实时传输给手机app (Application,应用程序),用户通过手机app便能对实际场景进行监控。然而,当用户开启 手机app的扬声器,并在距离安防摄像头较近的地方观看安防摄像头的画面时,安防摄像头 采集环境中的声音发送给手机app,手机app再将此声音通过扬声器播放出来,而扬声器播 放的音频会重新被安防摄像头的麦克风采集到,如此循环往复,声音不断叠加,导致容易产 生啸叫。 因此,对音频进行啸叫检测及抑制是避免产生啸叫的有效措施。目前,普遍采用频 点响度探测的方式来进行啸叫检测。具体地,当检测到某个频点连续若干帧的频谱能量均 达到一定值时,判定这个频点可能存在啸叫的现象。在判定该频点具有啸叫的现象后,将该 频点的增益进行抑制,从而实现消除啸叫。但是,该方法难以区别啸叫声和其他声音,因此 容易将非啸叫的频点误判为有啸叫的频点,误检率较高;而且,将非啸叫的频点误判为有啸 叫的频点,并进行抑制处理后,必然会造成音频的失真,导致对原始音频造成损坏。
技术实现要素:
本发明的目的是提供一种音频信号的处理方法、装置、安防摄像头及存储介质,能 够降低误检率,提高啸叫检测的准确度,从而保证音频的质量。 为了解决上述技术问题,本发明提供一种音频信号的处理方法,包括: 当接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数组 中; 当所述第一数组中的音频帧的数量达到预设的数量阈值时,根据预先配置的第二 数组,判断所述第一数组中的音频帧的每一频点对应的处理数值是否为零;其中,所述第二 数组包含有与每一频点一一对应的处理数值,所述处理数值用于指示后续接收到的音频帧 的数量,并对该数量的音频帧对应的频点进行啸叫抑制处理,所述处理数值的初始值为零; 当判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一 数组中依次选取每一音频帧的该频点,构成第三数组; 计算所述第三数组中的频点的周期; 当确定所述第三数组中的频点的周期符合预设的条件时,将所述第二数组中该频 点对应的处理数值更新为预设数值; 4 CN 111583943 A 说 明 书 2/9 页 在完成对所述第一数组中的音频帧的每一频点的处理后,将所述第一数组中的首 个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所述第一数组的末尾。 作为优选方案,所述音频信号的处理方法,还包括: 当判定所述第一数组中的音频帧的任一频点对应的处理数值大于零时,将所述第 二数组中该频点对应的处理数值减一; 对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理。 作为优选方案,所述计算所述第三数组中的频点的周期,具体包括: 根据所述第三数组中的每一频点,通过以下公式依次计算所述第三数组的自相关 函数值,并由依次获得的所述自相关函数值构成第四数组: 其中,k为时间偏移量, T为所述第三数组的长度;R[k]为当时间偏移 量为k时,所述第三数组的自相关函数值;x[i]为所述第三数组中的第i个频点; 以所述第四数组中数值最大的自相关函数值的位置的下标,作为所述第三数组中 的频点的周期。 作为优选方案,所述音频信号的处理方法,还包括: 根据所述第三数组中的每一频点,计算所述第三数组的均值; 所述预设的条件为同时满足: 所述第三数组中的频点的周期处于预设的数值范围,且所述第三数组中的频点的 周期与所述第三数组的均值之比大于预设的比值。 作为优选方案,所述对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处 理,具体包括: 通过以下公式,对所述第一数组中的末尾的音频帧的该频点进行啸叫抑制处理: F[f]new=F[f]old*a 其中,F[f]new为处理后的所述第一数组中的末尾的音频帧的该频点;F[f]old为处 理前的所述第一数组中的末尾的音频帧的该频点;a为预设的衰减值,0≤a<1。 作为优选方案,所述当接收到音频信号时,将所述音频信号中的音频帧依次插入 预先配置的第一数组中,具体包括: 当接收到所述音频信号时,将循环接收到的多个频点组成一个音频帧; 对每一所述音频帧进行傅里叶变换,获得每一所述音频帧的频域信号; 按照音频帧的接收顺序,将每一所述音频帧的频域信号依次插入所述第一数组 中。 作为优选方案,所述在完成对所述第一数组中的音频帧的每一频点的处理后,将 所述第一数组中的首个插入的音频帧发送至终端设备,并将接收到的下一个音频帧插入所 述第一数组的末尾,具体包括: 在完成对所述第一数组中的音频帧的每一频点的处理后,对所述第一数组中的首 5 CN 111583943 A 说 明 书 3/9 页 个插入的音频帧进行逆傅里叶变换,获得所述首个插入的音频帧的时域信号; 将所述首个插入的音频帧的时域信号发送至所述终端设备; 在发送之后,将接收到的下一个音频帧的频域信号插入所述第一数组的末尾。 为了解决相同的技术问题,相应地,本发明实施例还提供一种音频信号的处理装 置,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机 程序,所述处理器执行所述计算机程序时实现上述的音频信号的处理方法。 为了解决相同的技术问题,本发明实施例还提供一种安防摄像头,包括上述的音 频信号的处理装置。 为了解决相同的技术问题,本发明实施例还提供一种计算机可读存储介质,所述 存储介质上存储有程序,当所述程序运行时,实现上述的音频信号的处理方法。 与现有技术相比,本发明提供一种音频信号的处理方法、装置、安防摄像头及存储 介质,通过在接收到音频信号时,将所述音频信号中的音频帧依次插入预先配置的第一数 组中,并在判定所述第一数组中的音频帧的任一频点对应的处理数值为零时,从所述第一 数组中依次选取每一音频帧的该频点构成所述第三数组,以使在确定所述第三数组中的频 点的周期符合预设的条件时,将所述第二数组中该频点对应的处理数值更新为预设数值, 以指示在后续接收到的预设数值个音频帧中,对该频点进行啸叫抑制处理,从而实现了有 效的啸叫检测及抑制处理,降低了误检率,进而提高了啸叫检测的准确度,减少了误检导致 对非啸叫的频点进行抑制处理而造成音频失真的问题,因此保证了音频的质量。 附图说明 图1是本发明实施例提供的一种音频信号的处理方法的流程示意图; 图2是本发明实施例提供的另一种音频信号的处理方法的流程示意图; 图3是本发明实施例提供的音频信号的处理装置的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏