技术摘要:
本发明实施例公开了语音输入信息的方法及终端设备,所述方法包括:当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中插入第一信息的语音指令;将所述语音指令转化为搜索指令;根据所述搜索指令搜索所述第一信息;将搜索到的所述第一信息插入所述文本。 全部
背景技术:
在手机等具有文本编辑功能的智能终端设备上,用户在文本编辑过程中可能需要 插入电话号码或图片等特定信息。以用户在编辑短消息的过程中插入电话号码为例,当用 户打开短消息编辑软件后,如果要插入通讯录中某个联系人的电话号码,则需要手动打开 通讯录软件,并找到该联系人的电话号码,将该电话号码复制到内存中,然后返回短消息编 辑软件,通过粘贴操作将内存中的电话号码插入到短消息内容中。 发明人在对现有技术的研究过程中发现,用户在通过终端设备编辑文本过程中, 需要手动操作打开多个应用,才能插入电话号码或图片等信息,因此操作过程繁琐。
技术实现要素:
本发明实施例中提供了语音输入信息的方法及终端设备,以简化插入信息时的操 作过程。 为了解决上述技术问题,本发明实施例公开了如下技术方案: 第一方面,提供一种语音输入信息的方法,所述方法包括: 当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑的文本中插入第一 信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第一信息包括电话号码 或图片; 所述终端设备将所述语音指令转化为搜索指令,所述搜索指令为能够由所述终端 设备直接执行的命令; 所述终端设备根据所述搜索指令搜索所述第一信息; 所述终端设备将搜索到的所述第一信息插入所述文本。 结合第一方面,在第一方面的第一种可能的实现方式中,所述终端设备将所述语 音指令转化为搜索指令,具体包括: 所述终端设备将所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所 述语音指令进行语音识别,获得文本识别结果; 所述终端设备获得所述语音识别引擎返回的文本识别结果; 所述终端设备将所述文本识别结果传输到语义识别引擎,以使所述语义识别引擎 对所述文本识别结果进行解析,获得语义识别结果; 所述终端设备获得所述语义识别引擎返回的语义识别结果; 所述终端设备对所述语义识别结果进行转换,生成搜索指令。 结合第一方面的第一种可能的实现方式,在第一方面的第二种可能的实现方式 中,所述语义识别结果包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令 的动作类型为插入; 4 CN 111581462 A 说 明 书 2/11 页 所述终端设备对所述语义识别结果进行转换,生成搜索指令具体为:所述终端设 备将所述语音指令的动作类型、关键字和对象转换为搜索指令,其中,所述搜索指令的动作 类型为搜索,所述搜索指令的关键字与所述语音指令的关键字一致,所述搜索指令的对象 与所述语音指令的对象一致。 结合第一方面,或第一方面的第一种可能的实现方式,或第一方面的第二种可能 的实现方式,在第一方面的第三种可能的实现方式中,所述终端设备根据所述搜索指令搜 索所述第一信息,具体包括: 所述终端设备将所述搜索指令传输到搜索引擎,以使所述搜索引擎根据所述搜索 指令从搜索对象库中查询所述第一信息; 所述终端设备接收所述搜索引擎查询到的所述第一信息。 结合第一方面,或第一方面的第一种可能的实现方式,或第一方面的第二种可能 的实现方式,或第一方面的第三种可能的实现方式,在第一方面的第四种可能的实现方式 中,所述终端设备根据所述搜索指令搜索所述第一信息后,所述方法还包括: 当所述终端设备未搜索到所述第一信息时,输出错误信息;或者, 当所述终端设备搜索到多个所述第一信息时,获得用户从所述多个第一信息中选 择的第一信息; 所述终端设备将搜索到的所述第一信息插入所述文本,具体为:所述终端设备将 所述用户选择的第一信息插入所述文本。 第二方面,提供一种终端设备,所述终端设备包括: 接收单元,用于当所述终端设备呈现编辑信息的图形用户界面时,接收向正在编 辑的文本中插入第一信息的语音指令,所述语音指令为通过声纹信息表征的命令,所述第 一信息包括电话号码或图片; 转化单元,用于将所述接收单元接收到的语音指令转化为搜索指令,所述搜索指 令为能够由所述终端设备直接执行的命令; 搜索单元,用于根据所述转化单元转化的搜索指令搜索所述第一信息; 插入单元,用于将所述搜索单元搜索到的所述第一信息插入所述文本。 结合第二方面,在第二方面的第一种可能的实现方式中,所述转化单元包括: 语音指令传输子单元,用于将所述语音指令传输到语音识别引擎,以使所述语音 识别引擎对所述语音指令进行语音识别,获得文本识别结果; 文本结果接收子单元,用于获得所述语音识别引擎返回的文本识别结果; 文本结果传输子单元,用于将所述文本结果接收子单元获得的文本识别结果传输 到语义识别引擎,以使所述语义识别引擎对所述文本识别结果进行解析,获得语义识别结 果; 语义结果接收子单元,用于获得所述语义识别引擎返回的语义识别结果; 搜索指令生成子单元,用于对所述语义结果接收子单元获得的语义识别结果进行 转换,生成搜索指令。 结合第二方面的第一种可能的实现方式,在第二方面的第二种可能的实现方式 中,所述语义结果接收子单元接收到的语义识别结果包括:所述语音指令的动作类型、关键 字和对象,其中,所述语音指令的动作类型为插入; 5 CN 111581462 A 说 明 书 3/11 页 所述搜索指令生成子单元,具体用于将所述语音指令的动作类型、关键字和对象 转换为搜索指令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语 音指令的关键字一致,所述搜索指令的对象与所述语音指令的对象一致。 结合第二方面,或第二方面的第一种可能的实现方式,或第二方面的第二种可能 的实现方式,在第二方面的第三种可能的实现方式中,所述搜索单元包括: 搜索指令传输子单元,用于将所述搜索指令传输到搜索引擎,以使所述搜索引擎 根据所述搜索指令从搜索对象库中查询所述第一信息; 信息接收子单元,用于接收所述搜索引擎查询到的所述第一信息。 结合第二方面,或第二方面的第一种可能的实现方式,或第二方面的第二种可能 的实现方式,或第二方面的第三种可能的实现方式,在第二方面的第四种可能的实现方式 中,所述终端设备还包括: 输出单元,用于当所述搜索单元未搜索到所述第一信息时,输出错误信息; 获得单元,用于当所述搜索单元搜索到多个所述第一信息时,获得用户从所述多 个第一信息中选择的第一信息; 所述插入单元,还用于将所述获得单元获得的用户选择的第一信息插入所述文 本。 第三方面,提供一种终端设备,所述终端设备包括:总线,以及通过所述总线连接 的显示屏、麦克风及处理器;其中, 所述显示屏,用于呈现编辑信息的图形用户界面; 所述麦克风,用于接收向正在编辑的文本中插入第一信息的语音指令,所述语音 指令为通过声纹信息表征的命令,所述第一信息包括电话号码或图片; 所述处理器,用于将所述语音指令转化为搜索指令,所述搜索指令为能够由所述 终端设备直接执行的命令,根据所述搜索指令搜索所述第一信息,并将搜索到的所述第一 信息插入所述文本。 结合第三方面,在第三方面的第一种可能的实现方式中,所述处理器,具体用于将 所述语音指令传输到语音识别引擎,以使所述语音识别引擎对所述语音指令进行语音识 别,获得文本识别结果,将所述文本识别结果传输到语义识别引擎,以使所述语义识别引擎 对所述文本识别结果进行解析,获得语义识别结果,获得所述语义识别引擎返回的语义识 别结果,并对所述语义识别结果进行转换,生成搜索指令。 结合第三方面的第一种可能的实现方式,在第三方面的第二种可能的实现方式 中,所述语义识别结果包括:所述语音指令的动作类型、关键字和对象,其中,所述语音指令 的动作类型为插入; 所述处理器,具体用于将所述语音指令的动作类型、关键字和对象转换为搜索指 令,其中,所述搜索指令的动作类型为搜索,所述搜索指令的关键字与所述语音指令的关键 字一致,所述搜索指令的对象与所述语音指令的对象一致。 结合第三方面,或第三方面的第一种可能的实现方式,或第三方面的第二种可能 的实现方式,在第三方面的第三种可能的实现方式中,所述处理器,具体用于将所述搜索指 令传输到搜索引擎,以使所述搜索引擎根据所述搜索指令从搜索对象库中查询所述第一信 息,并接收所述搜索引擎查询到的所述第一信息。 6 CN 111581462 A 说 明 书 4/11 页 结合第三方面,或第三方面的第一种可能的实现方式,或第三方面的第二种可能 的实现方式,或第三方面的第三种可能的实现方式,在第三方面的第四种可能的实现方式 中,所述处理器,还用于当未搜索到所述第一信息时,通过所述显示屏输出错误信息,或者 当搜索到多个所述第一信息时,获得用户从所述多个第一信息中选择的第一信息,并将所 述用户选择的第一信息插入所述文本。 本发明实施例中,当终端设备呈现编辑信息的图形用户界面时,接收向正在编辑 的文本中插入第一信息的语音指令,将语音指令转化为搜索指令,根据搜索指令搜索第一 信息,并将搜索到的所述第一信息插入所述文本。应用本发明实施例,用户在通过终端设备 编辑文本的过程中,无需手动打开多个应用,而是通过语音指令即可在编辑文本中插入电 话号码或图片等信息,因此简化了插入信息的操作过程。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而 言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 图1为本发明语音输入信息的方法的一个实施例流程图; 图2A为本发明语音输入信息实施例的应用架构示意图; 图2B为本发明语音输入信息的方法的另一个实施例流程图; 图3为本发明语音输入信息的方法的另一个实施例流程图; 图4为本发明终端设备的一个实施例框图; 图5为本发明终端设备的另一个实施例框图; 图6为本发明终端设备的另一个实施例框图。