技术摘要:
本发明公开了一种基于语义的实体关系提取方法,包括:Step1、获取一段句子中的多个实体;获取该段句子中词语的依存关系树;Step2、将多个实体两两组合,获得多个实体组{A,B};其中A在句子中的位置排在B的位置之前;Step3、对每个实体组{A,B},执行以下步骤:Step3‑1 全部
背景技术:
在自然语言处理领域中,时常需要分析实体之间的关系,目前技术中主要的关系 提取方法为采用机器学习的方式进行关系提取,例如中国发明专利CN201811522442.7一种 基于语义依存图的关系提取方法,就采用了训练过的双向循环卷积注意神经网络来进行关 系提取,此种技术提取出的实体间的关系准确度太依赖训练的好坏,能够提取一些的实体 间的关系,但提取效果不好。
技术实现要素:
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于语义 的实体关系提取方法,其提取效果更好。 为解决上述技术问题,本发明采用的技术方案是:一种基于语义的实体关系提取 方法,包括以下步骤: Step1、获取一段句子中的多个实体;获取该段句子中词语的依存关系树; Step2、将多个实体两两组合,获得多个实体组{A,B};其中A在句子中的位置排在B 的位置之前; Step3、对每个实体组{A,B},执行以下步骤: Step3-1、根据依存关系树,获取实体B的一个未获取过的动词父节点head-V; Step3-2、判断该动词父节点head-V的直接父节点head是否为实体A,若是,则进入 Step3-3;若否,则进入Step3-4; Step3-3、输出实体A和实体B的关系为所述动词父节点head-V; Step3-4、判断该动词父节点head-V的直接子节点children中是否有实体A,若有, 则进入Step3-3,若无,则进入Step3-5; Step3-5、判断实体B是否还有未获取过的动词父节点head-V,若有,进入Step3-1。 上述一种基于语义的实体关系提取方法,对每个实体组{A,B}执行Step3时,第一 次执行Step3-1时获取的动词父节点head-V为距离实体B最近的动词父节点head-V,从第二 次执行Step3-1时获取的动词父节点head-V为距离上一次获取过的动词父节点head-V最近 的实体B的动词父节点head-V。 上述一种基于语义的实体关系提取方法,所述Step3-3还包括判断当前动词父节 点head-V的直接子节点中是否有介词和/或否定词,若有,则输出实体A和实体B的关系的修 饰为介词和/或否定词。 上述一种基于语义的实体关系提取方法,还包括Step4、对Step3结束后未找到关 系的实体组{A,B},执行以下步骤: 3 CN 111611803 A 说 明 书 2/5 页 Step4-1、根据依存关系树,判断实体A是否是实体B的直接父节点head、或在实体B 的直接父节点head的直接子节点children中、或在实体B的直接子节点children中;若是, 则进入Step4-2; Step4-2、输出实体A和实体B的关系为“相关”。 上述一种基于语义的实体关系提取方法,Step4-1中根据依存关系树,判断实体A 是否是实体B的直接父节点head、或在实体B的直接父节点head的直接子节点children中、 或在实体B的直接子节点children中;若否,则进入Step4-3; Step4-3、根据依存关系树,判断实体A是否是实体B的多个父节点head之一、或是 在该多个父节点head之一的直接子节点children中;若是,则进入Step4-2;该多个父节点 head中距离实体B的最远的父节点head与实体B之间间隔不超过5个父节点head。 本发明与现有技术相比具有以下优点:本发明采用基于依存关系树根据语法去寻 找两个实体间的关系,相比现有技术其提取效果更好。 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 附图说明 图1为本发明提取原生动词关系类型时在依存关系树上的寻找路径示意图。 图2为本发明提取相关关系类型时在依存关系树上的寻找路径示意图。 图3为本发明的流程示意图。 图4为本发明Step3的流程示意图。 图5为本发明Step4的流程示意图。