logo好方法网

一种融合上下文特征方面级情感分类方法和装置


技术摘要:
本申请公开了一种融合上下文特征方面级情感分类方法和装置,对待预测方面级情感分析文本进行弱相关方面词静态屏蔽和分词处理,得到第一全局上下文,将其输入到构建的MHSA‑LCF模型,使得第一BERT嵌入层和第二BERT嵌入层分别提取第一全局上下文特征和第一局部上下文特征  全部
背景技术:
方面级情感分类是指在评论文本中或其他文本中针对给出的方面词,预测其情感 极性,不同于句子级情感分类,方面级情感分类是一种细粒度的情感分类任务。 目前,方面级情感分类方法主要基于深度学习,其集中在循环神经网络和卷积神 经网络领域。同大多数自然语言处理任务一样,方面级情感分类也采用了序列到序列编码 的模型。现有的方面级情感分类方法只考虑了方面词与句子级上下文的语义关联,没有考 虑方面词的局部上下文与方面词的强语义关联特性,存在不能充分利用挖掘方面词的局部 上下文对预测情感极性的作用的优点,使得情感极性预测存在准确率不高的问题;并且,现 有技术没有考虑到当同一个句子中存在多个方面词时,分析一个方面词时,与该方面词弱 相关或不相关的方面词对其情感分类产生干扰,从而影响情感极性预测准确率。
技术实现要素:
本申请提供了一种融合上下文特征方面级情感分类方法和装置,用于解决现有技 术中忽略了方面词的局部上下文与方面词的强语义关联特性以及弱相关或不相关的方面 词对情感分类的干扰,使得情感极性预测存在准确率不高的技术问题。 有鉴于此,本申请第一方面提供了一种融合上下文特征方面级情感分类方法,包 括: 构建MHSA-LCF模型,所述MHSA-LCF模型包括第一BERT嵌入层、第二BERT嵌入层、局 部特征学习层、MHSA层、交互学习层和输出层,所述局部特征学习层包括CDW层和CDM层; 将第一全局上下文输入到所述MHSA-LCF模型,使得所述第一BERT嵌入层和所述第 二BERT嵌入层分别对所述第一全局上下文进行处理,分别输出第一全局上下文特征和第一 局部上下文特征,所述MHSA层对所述第一全局上下文特征进行处理,输出第二全局上下文 特征,所述局部特征学习层对所述第一局部上下文特征进行处理,输出混合局部上下文特 征,所述交互学习层对所述第二全局上下文特征和所述混合局部上下文特征融合后的融合 特征进行处理,输出联合特征表示,所述输出层对所述联合特征表示进行处理,输出待预测 方面级情感分析文本中的情感极性结果; 其中,所述第一全局上下文通过对所述待预测方面级情感分析文本进行弱相关方 面词静态屏蔽和分词处理得到。 可选的,所述局部特征学习层对所述第一局部上下文特征进行处理,输出混合局 部上下文特征,包括: 所述局部特征学习层的所述CDM层对非局部上下文单词对应的所述第一局部上下 文特征进行清零,得到第二局部上下文特征; 4 CN 111581966 A 说 明 书 2/10 页 所述局部特征学习层的所述CDW层对非局部上下文单词对应的所述第一局部上下 文特征进行赋权,得到第三局部上下文特征; 所述局部特征学习层对所述第二局部上下文特征和所述第三局部上下文特征进 行特征融合,并对融合后的特征进行线性变换,得到混合局部上下文特征。 可选的,所述交互学习层对所述第二全局上下文特征和所述混合局部上下文特征 融合后的融合特征进行处理,输出联合特征表示,包括: 所述交互学习层对所述第二全局上下文特征和所述混合局部上下文特征进行特 征融合,得到融合特征; 所述交互学习层对线性变换后的所述融合特征进行MHSA编码,输出联合特征表 示。 可选的,所述将第一全局上下文输入到所述MHSA-LCF模型,之前还包括: 获取待训练方面级情感分析文本; 对所述待训练方面级情感分析文本进行弱相关方面词静态屏蔽处理; 对屏蔽处理后的所述待训练方面级情感分析文本进行分词处理,得到第二全局上 下文; 将所述第二全局上下文输入到所述MHSA-LCF模型,对所述MHSA-LCF模型进行训 练,得到训练好的所述MHSA-LCF模型。 可选的,所述对所述待训练方面级情感分析文本进行弱相关方面词静态屏蔽处 理,包括: 对所述训练方面级情感分析文本中的非目标方面词采用预置标记进行代替。 可选的,所述将所述第二全局上下文输入到所述MHSA-LCF模型,对所述MHSA-LCF 模型进行训练,得到训练好的所述MHSA-LCF模型,之前还包括: 对所述MHSA-LCF模型中的所述第一BERT嵌入层和所述第二BERT嵌入层进行预训 练。 可选的,所述输出层对所述联合特征表示进行处理,输出待预测方面级情感分析 文本中的情感极性结果,包括: 所述输出层对所述联合特征表示进行池化处理,得到降维联合特征向量; 所述输出层对所述降维联合特征向量进行softmax运算,输出待预测方面级情感 分析文本中的情感极性结果。 本申请第二方面提供了一种融合上下文特征方面级情感分类装置,包括: 模型构建单元,用于构建MHSA-LCF模型,所述MHSA-LCF模型包括第一BERT嵌入层、 第二BERT嵌入层、局部特征学习层、MHSA层、交互学习层和输出层,所述局部特征学习层包 括CDW层和CDM层; 情感极性预测单元,用于将第一全局上下文输入到所述MHSA-LCF模型,使得所述 第一BERT嵌入层和所述第二BERT嵌入层分别对所述第一全局上下文进行处理,分别输出第 一全局上下文特征和第一局部上下文特征,所述MHSA层对所述第一全局上下文特征进行处 理,输出第二全局上下文特征,所述局部特征学习层对所述第一局部上下文特征进行处理, 输出混合局部上下文特征,所述交互学习层对所述第二全局上下文特征和所述混合局部上 下文特征融合后的融合特征进行处理,输出联合特征表示,所述输出层对所述联合特征表 5 CN 111581966 A 说 明 书 3/10 页 示进行处理,输出待预测方面级情感分析文本中的情感极性结果; 其中,所述第一全局上下文通过对所述待预测方面级情感分析文本进行弱相关方 面词静态屏蔽和分词处理得到。 可选的,还包括: 获取单元,用于获取待训练方面级情感分析文本; 屏蔽处理单元,用于对所述待训练方面级情感分析文本进行弱相关方面词静态屏 蔽处理; 分词处理单元,用于对屏蔽处理后的所述待训练方面级情感分析文本进行分词处 理,得到第二全局上下文; 训练单元,用于将所述第二全局上下文输入到所述MHSA-LCF模型,对所述MHSA- LCF模型进行训练,得到训练好的所述MHSA-LCF模型。 可选的,还包括: 预训练单元,用于对所述MHSA-LCF模型中的所述第一BERT嵌入层和所述第二BERT 嵌入层进行预训练。 从以上技术方案可以看出,本申请具有以下优点: 本申请提供了一种融合上下文特征方面级情感分类方法,包括:构建MHSA-LCF模 型,MHSA-LCF模型包括第一BERT嵌入层、第二BERT嵌入层、局部特征学习层、MHSA层、交互学 习层和输出层,局部特征学习层包括CDW层和CDM层;将第一全局上下文输入到MHSA-LCF模 型,使得第一BERT嵌入层和第二BERT嵌入层分别对第一全局上下文进行处理,分别输出第 一全局上下文特征和第一局部上下文特征,MHSA层对第一全局上下文特征进行处理,输出 第二全局上下文特征,局部特征学习层对第一局部上下文特征进行处理,输出混合局部上 下文特征,交互学习层对第二全局上下文特征和混合局部上下文特征融合后的融合特征进 行处理,输出联合特征表示,输出层对联合特征表示进行处理,输出待预测方面级情感分析 文本中的情感极性结果;其中,第一全局上下文通过对待预测方面级情感分析文本进行弱 相关方面词静态屏蔽和分词处理得到。 本申请中的融合上下文特征方面级情感分类方法,通过对待预测方面级情感分析 文本进行弱相关方面词静态屏蔽,减少弱相关或不相关的方面词对情感分类的干扰;将分 词处理后得到的第一全局上下文输入到构建的MHSA-LCF模型,通过MHSA-LCF模型中的第一 BERT嵌入层和第二BERT嵌入层分别提取第一全局上下文特征和第一局部上下文特征,通过 局部特征学习层对第一局部上下文特征进行处理,挖掘方面词的局部上下文与方面词的强 语义关联关系,通过局部特征学习层的CDW层和CDM层来学习两种局部上下文特征,并将这 两种局部上下文特征进行结合,得到混合局部上下文特征;通过MHSA层对第一全局上下文 特征进行处理,加强特征的刻画能力;通过交互学习层对第二全局上下文特征和混合局部 上下文特征进行融合,并对融合后的融合特征进行处理,增强特征表示,从而提高情感预测 的准确率,解决了现有技术中忽略了方面词的局部上下文与方面词的强语义关联特性以及 弱相关或不相关的方面词对情感分类的干扰,使得情感极性预测存在准确率不高的技术问 题。 6 CN 111581966 A 说 明 书 4/10 页 附图说明 图1为本申请实施例提供的一种融合上下文特征方面级情感分类方法的一个流程 示意图; 图2为本申请实施例提供的一种融合上下文特征方面级情感分类方法的另一个流 程示意图; 图3为本申请实施例提供的一种融合上下文特征方面级情感分类装置的一个结构 示意图; 图4为本申请实施例提供的分词处理后的餐厅评论文本的示意图; 图5为本申请实施例中提供的MHSA-LCF模型的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏