logo好方法网

一种多任务意图分类方法、装置、设备及存储介质


技术摘要:
本发明公开了一种多任务意图分类方法、装置、设备及存储介质,该方法包括:获取文本信息,将文本信息转换为词向量;将词向量转换为第一隐藏状态向量;利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。该方法实现避免槽  全部
背景技术:
目前,智能机器人交互是实现城市智能化的一项重要工作。近年来,随着计算机集 群计算能力的大幅度提升,人工智能算法研究和产业落地步入了发展快车道,而智能机器 人交互作为人工智能重要分支——自然语言处理的一个重要应用,也逐渐成为学术界、工 业界重点投入的研究热点和产品方向。无论在教育领域,金融领域,还是医疗领域都有着广 泛的应用,通过使用智能机器人,可以提高效率,减少人力资源。智能机器人交互对社会经 济效益和国家科技发展都具有重大意义。 命名实体识别在智能机器人交互系统中,需要从用户的提问中准确的识别出各种 实体的类型才能更好地回答用户,例如:“我想订一张后天从杭州到三亚的机票?”“从三亚 飞杭州的机票多少钱?”,分别需要准确地识别出“后天”,“三亚”和“杭州”才能准确回答用 户的问题。对话系统需要接收纯文本形式的自然语言,必需经过实体识别将无结构化的数 据转化为结构化数据,才能进行后续的意图识别等步骤。 意图识别也被称为SUC(Spoken  Utterance  Classification),是将用户输入的自 然语言会话进行划分,类别(classification)对应的就是用户意图。例如“今天天气如何”, 其意图为“询问天气”。自然地,可以将意图识别看作一个典型的分类问题。意图的分类和定 义可参考ISO-24617-2标准,其中共有56种详细的定义。面向任务的对话系统中的意图识别 通常可以视为文本分类任务。同时,意图的定义与对话系统自身的定位和所具有的知识库 有很大关系,即意图的定义具有非常强的领域相关性。意图分类是口语理解(SLU)系统中的 重要任务。 现有技术中,开始联合处理意图分类(ID)和填槽(SF)任务一起完成多任务意图分 类处理。但是,当前的联合模型需要大量手动标注的数据样本,手动标注数据需要很多成 本,尤其是槽位标记。因此,如何避免槽位标记,节省人工成本是亟待解决的问题。
技术实现要素:
本发明的目的是提供一种多任务意图分类方法、装置、设备及存储介质,以实现避 免槽位标记,节省人工成本。 为解决上述技术问题,本发明提供一种多任务意图分类方法,包括: 获取文本信息,将文本信息转换为词向量; 将词向量转换为第一隐藏状态向量; 利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任务,得到意图分 类结果和实体识别结果。 优选的,所述将文本信息转换为词向量,包括: 3 CN 111597342 A 说 明 书 2/7 页 从文本信息中提取词信息; 将词信息进行向量转换,生成词向量。 优选的,所述将词向量转换为第一隐藏状态向量,包括: 将词向量输入至第一双向LSTM神经网络,输出得到第一隐藏状态向量。 优选的,所述利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任 务,得到意图分类结果和实体识别结果,包括: 将第一隐藏状态向量输入至意图分类任务,执行意图分类任务得到意图分类结 果; 将第一隐藏状态向量输入至命名实体识别任务,执行命名实体识别任务得到实体 识别结果。 优选的,所述将第一隐藏状态向量输入至意图分类任务,执行意图分类任务得到 意图分类结果,包括: 将第一隐藏状态向量输入至第二双向LSTM神经网络,输出得到对话意图; 将对话意图输入至softmax分类层,输出得到意图分类结果。 优选的,所述第一隐藏状态向量输入至命名实体识别任务,执行命名实体识别任 务得到实体识别结果,包括: 将第一隐藏状态向量输入至单向LSTM神经网络,输出得到第二隐藏状态向量; 将第二隐藏状态向量输入至条件随机场CRF,输出得到实体识别结果。 优选的,所述将词向量转换为第一隐藏状态向量之后,还包括: 对第一隐藏状态向量进行正则化,得到正则化结果。 本发明还提供一种多任务意图分类装置,包括: 第一转换模块,用于获取文本信息,将文本信息转换为词向量; 第二转换模块,用于将词向量转换为第一隐藏状态向量; 执行模块,用于利用第一隐藏状态向量分别执行意图分类任务和命名实体识别任 务,得到意图分类结果和实体识别结果。 本发明还提供一种多任务意图分类设备,包括: 存储器,用于存储计算机程序; 处理器,用于执行所述计算机程序时实现如上任一项所述的多任务意图分类方法 的步骤。 本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算 机程序,所述计算机程序被处理器执行时实现如上任一项所述的多任务意图分类方法的步 骤。 本发明所提供的一种多任务意图分类方法、装置、设备及存储介质,获取文本信 息,将文本信息转换为词向量;将词向量转换为第一隐藏状态向量;利用第一隐藏状态向量 分别执行意图分类任务和命名实体识别任务,得到意图分类结果和实体识别结果。可见,不 再是联合意图分类任务和填槽任务,而是利用第一隐藏状态向量分别执行意图分类任务和 命名实体识别任务,即使用命名实体识别任务替换联合模型中的填槽任务,联合意图分类 任务和命名实体识别任务实现多任务意图分类,避免槽位标记,节省人工成。并且,由于意 图分类任务和命名实体识别任务共同使用了底层的共享特征,提升了意图分类任务的意图 4 CN 111597342 A 说 明 书 3/7 页 分类结果准确性。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 提供的附图获得其他的附图。 图1为本发明所提供的一种多任务意图分类方法的流程图; 图2为多任务意图分类模型示意图; 图3为意图分类单任务模型示意图; 图4为本发明所提供的一种多任务意图分类装置结构示意图; 图5为本发明所提供的一种多任务意图分类设备结构示意图。
下载此资料需消耗2积分,
分享到:
收藏