logo好方法网

信息处理装置、信息处理系统、信息处理方法和程序


技术摘要:
通过生成并使用其中收集了多个用户语音实例的语音收集列表,本发明实现了一种能够基于多个用户语音实例精确且重复地执行处理的装置和方法。学习处理单元生成语音收集列表,其中,收集对应于多个不同处理请求的多个用户语音实例。此外,在显示单元上显示生成的语音收集  全部
背景技术:
近年来,已经越来越多地使用语音交互系统,其执行用户话语的语音识别,并基于 识别结果执行各种处理和响应。 那些语音识别系统识别并理解通过麦克风输入的用户话语,并根据该识别和理解 执行处理。 例如,在用户说出“显示感兴趣的运动图像”的情况下,语音识别系统执行从运动 图像内容提供服务器获取运动图像内容并将运动图像内容输出到显示单元或连接的电视 机的处理。或者,在用户说出“关掉电视”的情况下,语音识别系统执行例如关闭电视的操 作。 通用语音交互系统具有例如自然语言理解功能,例如,自然语言理解(NLU),并且 通过应用自然语言理解(NLU)功能来理解用户话语的意图。 然而,例如,为了使语音交互系统连续执行多个处理,用户需要执行对应于多个处 理的多个用户话语。例如,一个示例如下。 “显示一个感兴趣的运动图像(moving  image)。” “播放古典音乐。” “我想继续玩昨天停止的游戏。” “我想和我的朋友玩游戏,所以请联系他们。” 例如,在做出这种连续的用户话语的情况下,用户很难立即确认系统是否能够理 解并执行所有这些话语。 实际上,用户需要在发出话语之后等待一段时间,以基于执行结果来确认是否响 应于用户话语执行了处理。 在没有执行处理的情况下,需要执行关于没有执行的处理的重复话语的处理、关 于该处理的重复话语的处理或其他处理。 这种响应给用户带来了沉重的负担。此外,完成这些处理所需时间的增加是有问 题的。 公开了用于基于用户话语安全地执行处理请求的配置的相关技术是例如专利文 献1(日本专利申请公开号2007-052397)。该文献公开了一种配置,其中,在显示单元上预先 显示可以输入到汽车导航系统的语音命令的列表,使得用户可以在查看该列表的同时输入 语音命令。 这种配置使得能够使用户发出汽车导航系统能够理解的用户话语(命令)。因此, 可以降低执行汽车导航系统不能理解的用户话语(命令)的可能性。 4 CN 111587413 A 说 明 书 2/34 页 这种配置可以将用户话语与系统中登记的命令相匹配。然而,如上所述,为了使配 置连续执行多个处理请求,用户需要从列表中搜索与用户想要的多个处理相对应的多个命 令。这增加了用户的负担。此外,结果,出现了完成这些处理所需的时间增加的问题。 引文目录 专利文献 专利文献1:日本专利申请公开号2007-052397
技术实现要素:
本发明要解决的问题 考虑到例如上述问题,已经构成了本公开,并且其目的是提供一种能够更安全地 根据用户话语执行处理的信息处理装置、信息处理系统、信息处理方法以及程序。 此外,本公开的实施方式提供了一种能够在共同执行多个不同的处理的情况下安 全地执行用户请求的多个处理的信息处理装置、信息处理系统、信息处理方法以及程序。 问题的解决方案 本公开的第一方面是 一种信息处理装置,包括 学习处理单元,其被配置为执行用户话语的学习处理,其中, 所述学习处理单元生成话语收集列表,其中,收集对应于多个不同处理请求的多 个用户话语。 此外,本公开的第二方面是 一种信息处理系统,包括 用户终端;以及 数据处理服务器,其中: 所述用户终端包括 语音输入单元,其被配置为输入用户话语; 所述数据处理服务器包括 学习处理单元,其被配置为执行从用户终端接收的用户话语的学习处理;并且 所述学习处理单元生成话语收集列表,其中,收集对应于多个不同处理请求的多 个用户话语。 此外,本公开的第三方面是 一种在信息处理装置中执行的信息处理方法,其中: 所述信息处理装置包括:学习处理单元,其被配置为执行用户话语的学习处理;并 且 所述学习处理单元生成话语收集列表,其中,收集对应于多个不同处理请求的多 个用户话语。 此外,本公开的第四方面是 一种在包括用户终端和数据处理服务器的信息处理系统中执行的信息处理方法, 其中: 所述用户终端执行输入用户话语的语音输入处理; 5 CN 111587413 A 说 明 书 3/34 页 所述数据处理服务器执行从用户终端接收的用户话语的学习处理;并且 在学习处理中生成话语收集列表,其中,收集对应于多个不同处理请求的多个用 户话语。 此外,本公开的第五方面是 一种用于使信息处理装置执行信息处理的程序,其中: 所述信息处理装置包括:学习处理单元,其被配置为执行用户话语的学习处理;并 且 所述程序使学习处理单元生成话语收集列表,其中,收集对应于多个不同处理请 求的多个用户话语。 注意,本公开的程序例如是可以由存储介质或通信介质以计算机可读格式提供的 程序,用于可以执行各种程序代码的信息处理装置或计算机系统。通过以计算机可读格式 提供这种程序,在信息处理装置或计算机系统中实现根据该程序的处理。 基于稍后描述的本公开的实施方式和附图的更详细的描述,本公开的其他目的、 特征和优点将变得显而易见。注意,在本说明书中,系统是多个装置的逻辑集合配置,并且 不限于具有相应配置的装置在同一外壳中的系统。 本发明的效果 根据本公开的实施方式的配置,能够基于多个用户话语准确且重复地执行处理的 装置和方法通过生成并使用收集了多个用户话语的话语收集列表来实现。 具体地,例如,学习处理单元生成话语收集列表,其中,收集了对应于多个不同处 理请求的多个用户话语。此外,在显示单元上显示生成的话语收集列表。在用户同意的情况 下,在确定已经成功执行了与用户话语对应的多个处理的情况下,在多个用户话语的组合 等于或大于预定阈值次数的情况下,在估计用户满意的情况下,或者在其他情况下,学习处 理单元生成话语收集列表,并将话语收集列表存储在存储单元中。 通过这种配置,能够基于多个用户话语精确地和重复地执行处理的装置和方法通 过生成和使用收集了多个用户话语的话语收集列表来实现。 注意,本说明书中描述的效果仅仅是示例,并不限于此,并且可以具有其他额外效 果。 附图说明 图1示出了基于用户话语执行响应和处理的信息处理装置的示例; 图2示出了信息处理装置的配置示例和使用示例; 图3示出了信息处理装置的具体配置示例; 图4示出了信息处理装置的显示数据的示例; 图5示出了信息处理装置的显示数据的示例; 图6示出了信息处理装置的显示数据的示例; 图7示出了信息处理装置的显示数据的示例; 图8示出了信息处理装置的显示数据的示例; 图9示出了信息处理装置的显示数据的示例; 图10示出了信息处理装置的显示数据的示例; 6 CN 111587413 A 说 明 书 4/34 页 图11示出了信息处理装置的显示数据的示例; 图12示出了信息处理装置的显示数据的示例; 图13示出了信息处理装置的显示数据的示例; 图14示出了信息处理装置的显示数据的示例; 图15示出了信息处理装置的显示数据的示例; 图16示出了信息处理装置的显示数据的示例; 图17示出了信息处理装置的显示数据的示例; 图18示出了信息处理装置的显示数据的示例; 图19示出了信息处理装置的显示数据的示例; 图20示出了信息处理装置的显示数据的示例; 图21示出了信息处理装置的显示数据的示例; 图22示出了信息处理装置的显示数据的示例; 图23示出了信息处理装置的显示数据的示例; 图24示出了信息处理装置的显示数据的示例; 图25示出了信息处理装置的显示数据的示例; 图26示出了信息处理装置的显示数据的示例; 图27示出了信息处理装置的显示数据的示例; 图28示出了信息处理装置的显示数据的示例; 图29示出了信息处理装置的显示数据的示例; 图30示出了信息处理装置的显示数据的示例; 图31示出了信息处理装置的显示数据的示例; 图32示出了信息处理装置的显示数据的示例; 图33示出了信息处理装置的显示数据的示例; 图34示出了信息处理装置的显示数据的示例; 图35示出了信息处理装置的显示数据的示例; 图36是示出由信息处理装置执行的处理序列的流程图; 图37是示出由信息处理装置执行的处理序列的流程图; 图38是示出由信息处理装置执行的处理序列的流程图; 图39是示出由信息处理装置执行的处理序列的流程图; 图40是示出由信息处理装置执行的处理序列的流程图; 图41示出了信息处理系统的配置示例; 图42示出了信息处理装置的硬件配置示例。
下载此资料需消耗2积分,
分享到:
收藏