技术摘要:
本公开属于语音检测技术领域,涉及一种长语音端点检测方法及装置、计算机可读存储介质、电子设备。该方法包括:获取待检测长语音的语音信号,并对语音信号进行分窗处理得到检测窗;在检测窗中确定一采样点为起始检测点,并计算起始检测点的起始能量比率;根据起始检测 全部
背景技术:
语音信号端点检测技术是语音信号处理技术中一个非常重要的方向,目的是从一 段包含语音的信号中准确地检测出语音的起始点和终止点,以区分语音信号和非语音信 号。有效的语音信号端点检测不仅能在语音识别、声纹识别等系统中减少语音数据采集的 成本,节约处理时间,还能排除无声段和噪声段的干扰,提升系统的性能。 目前应用最为广泛的语音信号端点检测技术是双门限法。双门限法根据信号的短 时能量和短时过零率这两个特征参数来区分语音和非语音。但是,双门限法需要设置很多 阈值,对于底噪不同的语音信号,每一次都调整阈值几乎是不可能的。除此之外,双门限法 用到的的都是短时的特征,在应用于长语音时,很容易判断失误。 鉴于此,本领域亟需开发一种新的长语音端点检测方法及装置。 需要说明的是,在上述
技术实现要素:
部分公开的信息仅用于加强对本公开的背景的理 解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。