语料处理方法、装置及存储介质-好方法网

技术摘要：
本公开是关于一种语料处理方法、装置及存储介质。语料处理方法包括：获取用户输入的信息；根据所述信息，从多个候选语料中检索与所述信息匹配的回复信息，所述多个候选语料为清除负面情感语料后得到的候选语料；发送与所述信息匹配的回复信息。通过本公开，使得开放域全部
背景技术：
人工智能(Artificial Intelligence，AI)是目前研究和开发用于模拟、延伸以及扩展人类智能的一门新兴科学技术。其中，AI的主要研究目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作，比如时下出现的聊天机器人便是对AI技术的一个实际应用。目前，针对开放域对话系统，开放域聊天机器人已成为重要的人机交互产品，但是在开放域对话中，开放域聊天机器人需要利用大量的候选语料用于回复。同时，如果开放域聊天机器人回复一些负面情感的回复，如抑郁、愤怒等情绪，会对用户造成严重的困扰，更有甚者会导致用户也染上同样的负面情绪。故，如何提高开放域聊天机器人候选语料的质量，以树立正面、积极的开放域聊天机器人成为了时下本领域技术人员亟待解决的一个技术问题。
技术实现要素：
为克服相关技术中存在的问题，本公开提供一种语料处理方法、装置及存储介质。根据本公开实施例的第一方面，提供一种语料处理方法，语料处理方法包括：获取用户输入的信息；根据信息，从多个候选语料中检索与信息匹配的回复信息，多个候选语料为清除负面情感语料后得到的候选语料；发送与信息匹配的回复信息。在一示例中，语料处理方法还包括：获取候选语料集；调用情感识别模型，情感识别模型根据输入的语料，输出语料的情感分数；将候选语料集中的候选语料输入情感识别模型，并依据情感识别模型的输出，以及预设的负面情感分数阈值，确定候选语料集中包含的负面情感候选语料；清除负面情感候选语料，得到多个候选语料。在一示例中，语料处理方法还包括：获取训练集，训练集中包括多个负面情感训练语料，和多个正面情感训练语料；将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数；基于训练语料的情感分数以及损失函数调整情感识别模型的参数，得到满足损失值的情感识别模型。在一示例中，语料处理方法还包括：获取验证集，验证集中包括多个负面情感验证语料，和多个正面情感验证语料；将多个负面情感验证语料和多个正面情感验证语料输入训练好的情感识别模型，通过训练好的情感识别模型输出验证语料的情感分数；根据输出的验证语料的情感分数，确定负面情感分数阈值。在一示例中，语料处理方法还包括：以预设的时间间隔为单位，获取更新后的候选语料集，依据情感识别模型的输出，确定更新后的候选语料集中包含的负面情感候选语料，并清除更新后的候选语料集中包含的负面情感候选语料。根据本公开实施例的第二方面，提供一种语料处理装置，语料处理装置包括：获取 4 CN 111553171 A 说　明　书 2/6 页单元，被配置为获取用户输入的信息；匹配单元，被配置为根据信息，从多个候选语料中检索与信息匹配的回复信息，多个候选语料为清除负面情感语料后得到的候选语料；发送单元，被配置为发送与信息匹配的回复信息。在一示例中，语料处理装置还包括：处理单元，被配置为通过如下方式清除负面情感语料，得到多个候选语料：获取候选语料集；调用情感识别模型，情感识别模型根据输入的语料，输出语料的情感分数；将候选语料集中的候选语料输入情感识别模型，并依据情感识别模型的输出，以及预设的负面情感分数阈值，确定候选语料集中包含的负面情感候选语料；清除负面情感候选语料，得到多个候选语料。在一示例中，语料处理装置还包括：训练单元，被配置为通过如下方式训练情感识别模型：获取训练集，训练集中包括多个负面情感训练语料，和多个正面情感训练语料；将多个负面情感训练语料和多个正面情感训练语料输入情感识别模型，通过情感识别模型输出训练语料的情感分数；基于训练语料的情感分数以及损失函数调整情感识别模型的参数，得到满足损失值的情感识别模型。在一示例中，语料处理装置还包括：验证单元，被配置为获取验证集，验证集中包括多个负面情感验证语料，和多个正面情感验证语料；将多个负面情感验证语料和多个正面情感验证语料输入训练好的情感识别模型，通过训练好的情感识别模型输出验证语料的情感分数；根据输出的验证语料的情感分数，确定负面情感分数阈值。在一示例中，语料处理装置还包括：处理单元，被配置为以预设的时间间隔为单位，获取更新后的候选语料集，依据情感识别模型的输出，确定更新后的候选语料集中包含的负面情感候选语料，并清除更新后的候选语料集中包含的负面情感候选语料。根据本公开的第三方面，提供了一种语料处理装置，语料处理装置包括：存储器，配置用于存储指令。以及处理器，配置用于调用指令执行前述第一方面或者第一方面中任意一示例中的语料处理方法。根据本公开的第四方面，提供了一种非临时性计算机可读存储介质，非临时性计算机可读存储介质存储有计算机可执行指令，计算机可执行指令在由处理器执行时，执行前述第一方面或者第一方面中任意一示例中的语料处理方法。本公开的实施例提供的技术方案可以包括以下有益效果：针对开放域聊天机器人，通过对开放域聊天机器人中的负面候选语料执行清除操作，使得开放域聊天机器人可根据用户输入的信息，输出正面、积极的回复信息，提升开放域聊天机器人与用户交流的紧密度，提升用户体验。应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。附图说明此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。图1是根据一示例性实施例示出的一种语料处理方法的流程图。图2是根据一示例性实施例示出的一种训练情感识别模型的流程图。图3是根据一示例性实施例示出的一种语料处理装置的框图。 5 CN 111553171 A 说　明　书 3/6 页图4是根据一示例性实施例示出的一种装置的框图。

相关推荐