logo好方法网

信息控制方法及装置、存储介质


技术摘要:
本公开是关于一种信息控制方法及装置、存储介质。该方法应用于语音设备中,包括:采集第一语音得到语音数据;将所述语音数据输入到语义分类模型,基于语义分析得到所述第一语音是否输入停止的判定结果;当确定所述判定结果为所述第一语音未停止输入时,继续采集第二语  全部
背景技术:
随着计算机和人工智能技术的飞速发展,智能语音对话也得到极大的发展。近几 年来,在语音交互技术中,为了达到流畅,自然,拟人化对话体验,出现了一种全双工的语音 交互技术。 图1为全双工语音交互的特点和涉及相关技术的示例图。如图1所示,全双工语音 交互有三个特点:1)一次唤醒,连续对话;2)边听边说,随时打断;3)更自然的表达。而这三 个特点,也带来了相应的技术挑战,包括:1)多轮对话能力;2)回声消除;3)无效音拒识;4) 智能判停和断句。如何提升全双工语音交互中语音交互的质量,特别是如何实现智能判停 和断句,有待进一步解决。
技术实现要素:
本公开提供一种信息控制方法及装置、存储介质。 根据本公开实施例的第一方面,提供一种信息控制方法,应用于语音设备,包括: 采集第一语音得到语音数据; 将所述语音数据输入到语义分类模型,基于语义分析得到所述第一语音是否输入 停止的判定结果; 当确定所述判定结果为所述第一语音未停止输入时,继续采集第二语音。 可选的,所述方法还包括: 当所述判定结果为所述第一语音停止输入时,则停止采集; 基于采集得到的所述语音数据进行语音指令的响应。 可选的,所述方法还包括: 根据所述第一语音的声音强度变化趋势确定所述第一语音的类型; 若所述第一语音的类型为带拖音的第二类型,根据所述第一语音的声音强度确定 所述第一语音是否输入停止; 所述将所述语音数据输入到语义分类模型,基于语义分析得到所述第一语音是否 输入停止的判定结果,包括: 若所述第一语音的类型为不带拖音的第一类型,将所述语音数据输入到所述语义 分类模型,基于语义分析得到所述第一语音是否输入停止的判定结果。 可选的,所述根据所述第一语音的声音强度确定所述第一语音是否输入停止,包 括: 确定所述第二类型的所述第一语音的声音强度是否持续降低至小于预定声音强 度阈值; 若所述第一语音的声音强度不小于所述预定声音强度阈值,则继续采集所述第二 4 CN 111583923 A 说 明 书 2/10 页 语音。 可选的,所述方法还包括: 确定在采集到所述第一语音的语音数据后的预设时长内是否有继续采集到语音; 所述将所述语音数据输入到语义分类模型,基于语义分析得到所述第一语音是否 输入停止的判定结果,包括: 若在所述预设时长内未继续采集到语音,将所述语音数据输入到所述语义分类模 型,基于语义分析得到所述第一语音是否输入停止的判定结果。 可选的,所述语义分类模型为对带标签的语音数据样本进行训练后得到的有监督 深度学习模型。 根据本公开实施例的第二方面,提供一种信息控制装置,应用于语音设备,包括: 采集模块,配置为采集第一语音得到语音数据; 分析模块,配置为将所述语音数据输入到语义分类模型,基于语义分析得到所述 第一语音是否输入停止的判定结果; 所述采集模块,还配置为当确定所述判定结果为所述第一语音未停止输入时,继 续采集第二语音。 可选的,所述装置还包括: 第一停止模块,配置为当所述判定结果为所述第一语音停止输入时,则停止采集; 第一响应模块,配置为基于采集得到的所述语音数据进行语音指令的响应。 可选的,所述装置还包括: 第一确定模块,配置为根据所述第一语音的声音强度变化趋势确定所述第一语音 的类型; 第二确定模块,配置为若所述第一语音的类型为带拖音的第二类型,根据所述第 一语音的声音强度确定所述第一语音是否输入停止; 所述分析模块,具体配置为若所述第一语音的类型为不带拖音的第一类型,将所 述语音数据输入到所述语义分类模型,基于语义分析得到所述第一语音是否输入停止的判 定结果。 可选的,所述第二确定模块,具体配置为确定所述第二类型的所述第一语音的声 音强度是否持续降低至小于预定声音强度阈值;若所述第一语音的声音强度不小于所述预 定声音强度阈值,则继续采集所述第二语音。 可选的,所述装置还包括: 第三确定模块,配置为确定在采集到所述第一语音的语音数据后的预设时长内是 否有继续采集到语音; 所述分析模块,具体配置为若在所述预设时长内未继续采集到语音,将所述语音 数据输入到所述语义分类模型,基于语义分析得到所述第一语音是否输入停止的判定结 果。 可选的,所述语义分类模型为对带标签的语音数据样本进行训练后得到的有监督 深度学习模型。 根据本公开实施例的第三方面,提供一种信息控制装置,包括: 处理器; 5 CN 111583923 A 说 明 书 3/10 页 用于存储处理器可执行指令的存储器; 其中,所述处理器被配置为执行如上述第一方面中所述的信息控制方法。 根据本公开实施例的第四方面,提供一种存储介质,包括: 当所述存储介质中的指令由计算机的处理器执行时,使得计算机能够执行如上述 第一方面中所述的信息控制方法。 本公开的实施例提供的技术方案可以包括以下有益效果: 本公开在采集第一语音得到语音数据后,会将语音数据输入到语义分类模型,基 于语义分析得到第一语音是否输入停止的判定结果,并在确定判定结果为语音未停止输入 时,继续采集第二语音。通过该方式,可减少因用户输入语音时的停顿使得语音数据被截断 而造成的语义不完整现象发生,能提升语音设备采集完整语义的语音数据的可能,进而可 提高电子设备响应的精确度,提升用户使用体验。 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。 附图说明 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施 例,并与说明书一起用于解释本公开的原理。 图1为全双工语音交互的特点和涉及相关技术的示例图。 图2是本公开实施例示出的一种信息控制方法流程图一。 图3是本公开实施例示出的一种信息控制方法流程图二。 图4是根据一示例性实施例示出的一种信息控制装置图。 图5是本公开实施例示出的一种语音设备的框图。
下载此资料需消耗2积分,
分享到:
收藏