logo好方法网

对话意图类型识别方法、多轮对话方法、装置及计算设备


技术摘要:
本发明公开了一种对话意图类型识别方法、一种多轮对话方法、装置及计算设备。其中对话意图类型识别方法包括:对当前轮对话文本进行实体识别,得到当前轮对话文本的实体和实体类型;对当前轮对话文本进行实体意图识别,得到当前轮对话文本的意图;融合当前轮对话文本的  全部
背景技术:
在任务型多轮对话系统模型的训练和建立中,一般需要大量的人工标注数据作为 训练和建立多轮对话系统模型的基础。若在用户意图不明确的情况下,不仅需要标注的数 据量成倍增长,还会由于答复内容不贴合语境等问题导致用户流失。 目前,为了解决在用户意图不明确的情况下造成的标注数据量大、答复内容不符 合语境等的问题,提出了意图识别的概念。但已有的意图识别仅通过将用户输入的语句进 行语义分析,简单分辨意图后,直接将分析出语义的词汇填进对应的槽位,导致对用户意图 识别的准确率偏低,较难对用户的潜在意图进行识别,并作出最贴合语境的回答。因此,如 何准确、高效的识别用户的潜在意图是亟需解决的问题。
技术实现要素:
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的对话意图类型识别方法、多轮对话方法、装置及计算设备。根据本发明的第一方 面,提供了一种对话意图类型识别方法,包括:对当前轮对话文本进行实体识别,得到当前 轮对话文本的实体和实体类型;对当前轮对话文本进行实体意图识别,得到当前轮对话文 本的意图;融合当前轮对话文本的实体、实体类型、意图及历史对话文本的实体、实体类型、 意图,得到实体集合、实体类型集合及意图集合;对实体集合、实体类型集合及意图集合中 的实体、实体类型、意图分别进行向量化处理,得到多个实体向量、实体类型向量及意图向 量;拼接实体向量、实体类型向量及意图向量,作为拼接向量;将拼接向量输入至分类模型, 得到所述当前轮对话文本的意图类型。 可选地,在根据本发明的对话意图类型识别方法中,当前轮对话文本利用词典匹 配和/或实体识别模型进行实体识别,当前轮对话文本利用意图识别模型进行意图识别。 可选的,在根据本发明的对话意图类型识别方法中,实体识别模型采用BERT CRF 模型,意图识别模型采用TextCNN模型。 可选的,在根据本发明的对话意图类型识别方法中,历史对话文本采用预定轮数 的最近对话文本。 可选的,在根据本发明的对话意图类型识别方法中,融合当前轮对话文本的实体、 实体类型、意图及历史对话文本的实体、实体类型、意图,包括:对当前轮对话文本的实体及 历史对话文本的实体归类;融合当前轮对话文本的实体类型、意图、历史对话文本的实体类 型、意图及归类后的实体,得到实体集合、实体类型集合及意图集合。 可选的,在根据本发明的对话意图类型识别方法中,实体类型采用如下方式进行 分类:判定实体是否已经存在于类别集合中,若不存在,则添加到类别集合中,并添加该实 4 CN 111581375 A 说 明 书 2/12 页 体出现的轮次标签,若存在,则更新该实体的轮次标签。 可选的,在根据本发明的对话意图类型识别方法中,分类模型包括特征提取器和 分类器,输入拼接向量至分类模型,得到当前轮对话的意图类型,包括:输入拼接向量至特 征提取器,得到特征向量;输入特征向量至分类器,得到意图类型概率;选择意图类型概率 中最大概率对应的意图类型,作为当前轮对话的意图类型。 可选的,在根据本发明的对话意图类型识别方法中,特征提取器采用CNN网络、RNN 网络、LSTM网络或者GRU网络,分类器采用SoftMax分类器。 根据本发明第二方面,提供一种对话意图类型识别装置,所述装置包括:应用于多 轮对话场景中,所述装置包括:实体识别单元,用于对当前轮对话文本进行实体识别,得到 当前轮对话文本的实体和实体类型;意图识别单元,用于对当前轮对话文本进行实体意图 识别,得到当前轮对话文本的意图;融合单元,用于融合当前轮对话文本的实体、实体类型、 意图及历史对话文本的实体、实体类型、意图,得到实体集合、实体类型集合及意图集合;向 量化处理单元,用于对实体集合、实体类型集合及意图集合中的实体、实体类型、意图分别 进行向量化处理,得到多个实体向量、实体类型向量及意图向量;向量拼接单元,用于拼接 实体向量、实体类型向量及意图向量,作为拼接向量;意图类型识别单元,用于将拼接向量 输入至分类模型,得到当前轮对话文本的意图类型。 可选地,在根据本发明的对话意图类型识别装置中,当前轮对话文本利用词典匹 配和/或实体识别模型进行实体识别,当前轮对话文本通过意图识别模型进行意图识别。 可选地,在根据本发明的对话意图类型识别装置中,实体识别模型采用BERT CRF 模型,意图识别模型采用TextCNN模型。 可选地,在根据本发明的对话意图类型识别装置中,历史对话文本采用预定轮数 的最近对话文本。 可选地,在根据本发明的对话意图类型识别装置中,融合单元的工作方式包括:对 当前轮对话文本的实体及历史对话文本的实体归类;融合当前轮对话文本的实体类型、意 图、历史对话文本的实体类型、意图及归类后的实体,得到实体集合、实体类型集合及所述 意图集合。 可选地,在根据本发明的对话意图类型识别装置中,实体类型采用如下方式进行 分类:判定实体是否已经存在于类别集合中,若不存在,则添加到类别集合中,并添加该实 体出现的轮次标签,若存在,则更新该实体的轮次标签。 可选地,在根据本发明的对话意图类型识别装置中,分类模型包括特征提取器和 分类器,意图类型识别单元的工作方式包括:输入拼接向量至特征提取器,得到特征向量; 输入特征向量至分类器,得到意图类型概率;选择意图类型概率中最大概率对应的意图类 型,作为当前轮对话的意图类型。 可选地,在根据本发明的对话意图类型识别装置中,特征提取器采用CNN网络、RNN 网络、LSTM网络或者GRU网络,分类器采用SoftMax分类器。 根据本发明的第三方面,提供了一种多轮对话方法,包括:确定当前轮对话文本的 意图类型,当前轮对话文本的意图类型是基于第一方面所述的对话意图类型识别方法确定 的;通过当前轮对话文本的意图类型,分析用户意图;基于用户意图,确定回复内容;返回回 复内容至客户端。 5 CN 111581375 A 说 明 书 3/12 页 可选地,在根据本发明的多轮对话方法中,还包括:基于当前轮对话文本的实体以 及用户意图,分析下一轮用户意图。 根据本发明第四方面,提供一种多轮对话装置,所述装置包括:意图类型确定单 元,用于确定当前轮对话文本的意图类型,当前轮对话文本的意图类型是基于第一方面所 述的对话意图类型识别方法确定的;用户意图预测单元,用于通过当前轮对话文本的意图 类型,预测用户意图,还用于基于当前轮对话文本的实体以及用户意图,分析下一轮用户意 图;回复内容确定单元,用于基于用户意图,确定回复内容;返回单元,用于返回回复内容至 客户端。 根据本发明第五方面,提供一种移动终端,包括:至少一个处理器;和存储有程序 指令的存储器,其中,程序指令被配置为适于由至少一个处理器执行,程序指令包括用于执 行上述方法中任一项所述的方法。 根据本发明第六方面,提供一种存储一个或多个程序的计算机可读存储介质,所 述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行上述 的方法中的任一方法。 根据本发明的意图类型识别方案,适于多轮对话中,通过对当前轮对话文本进行 实体识别及意图识别,得到当前轮对话文本的实体、实体类型及意图,接下来对当前轮对话 文本的实体、实体类型、意图及历史对话文本的实体、实体类型、意图进行融合,得到实体集 合、实体类型集合及意图集合,通过对实体集合、实体类型集合及意图集合中的多个实体、 实体类型以及意图进行向量化处理,得到多个实体向量、实体类型向量及意图向量,并对上 述向量进行拼接得到拼接向量,将拼接向量输入至分类模型,得到当前轮对话文本的意图 类型。通过该方案对当前轮对话文本意图类型进行预测,为得到当前轮对话中满足用户意 图、更加贴合用户语境的回复内容做铺垫。 基于意图类型识别方案,本发明又提供了多轮对话方案,该方案基于意图类型识 别方法确定当前轮对话文本的意图类型,进而在当前轮对话文本的意图类型中,预测用户 意图,最后通过预测的用户意图确定贴合语境的回复内容,将回复内容返回至客户端。该方 案利用了意图类型识别方案得到当前轮对话文本的意图类型,再基于当前轮对话文本的意 图类型实现对多轮对话中当前轮对话文本的意图预测,从而挖掘出用户潜在的需求,并根 据预测意图选择对话方式,进而得到满足用户需求的回复话术,使得多轮对话整个过程更 加的简洁高效,提高了多轮对话的用户满意度和完成率。 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的
分享到:
收藏