技术摘要:
本说明书提供了同义名称词的确定方法和同义名称词的知识库的建立方法。在一个实施例中,同义名称词的确定方法通过先获取包含有目标对象的第一名称词的第一语料数据,以及与第一语料数据关联的第二语料数据;再通过根据预设的处理规则对上述语料数据进行基于自然语言理 全部
背景技术:
在对数据对象进行风险检测时,常常需要根据该数据对象当前使用的名称,通过 检索匹配风险名单中记录的风险对象的名称,来判断该数据对象是否存风险。但是一个数 据对象往往可能会同时拥有或使用多个不同的名称。 因此,亟需一种能够较为准确、全面地挖掘出目标对象的同义名称词的方法。
技术实现要素:
本说明书提供了一种同义名称词的确定方法和同义名称词的知识库的建立方法, 以便能够有效避免遗漏,准确、全面地挖掘出目标对象的同义名称词。 本说明书提供的一种同义名称词的确定方法和同义名称词的知识库的建立方法 是这样实现的: 一种同义名称词的确定方法,包括:获取目标对象的第一名称词、第一语料数据, 以及第二语料数据,其中,所述第一语料数据为包含有目标对象的第一名称词的数据,所述 第二语料数据为与所述第一语料数据关联的数据;根据预设的处理规则,对所述第一语料 数据和所述第二语料数据分别进行基于自然语言理解的多组预设处理,得到处理后的第一 语料数据和处理后的第二语料数据;根据所述处理后的第一语料数据和所述处理后的第二 语料数据,确定文本数据的正则表达式,以及文本数据与目标对象的第一名称词之间的关 系参数;根据所述文本数据的正则表达式,以及所述文本数据与目标对象的第一名称词之 间的关系参数,从所述第一语料数据和所述第二语料数据中确定出目标对象的同义名称 词。 一种同义名称词的知识库的建立方法,包括:获取多个数据对象中各个数据对象 的第一名称词,以及第一语料数据和第二语料数据,其中,所述第一语料数据为包含有数据 对象的第一名称词的数据,所述第二语料数据为与第一语料数据关联的数据;根据预设的 处理规则,对所述第一语料数据和所述第二语料数据分别进行基于自然语言理解的多组预 设处理,得到处理后的第一语料数据和处理后的第二语料数据;根据所述处理后的第一语 料数据和所述处理后的第二语料数据,确定文本数据的正则表达式,以及文本数据与各个 数据对象的第一名称词之间的关系参数;根据所述文本数据的正则表达式,以及所述文本 数据与各个数据对象的第一名称词之间的关系参数,从所述第一语料数据和所述第二语料 数据挖掘出各个数据对象的同义名称词;根据所述各个数据对象的同义名称词,建立同义 名称词的知识库。 一种同义名称词的确定装置,包括:获取模块,用于获取目标对象的第一名称词、 第一语料数据,以及第二语料数据,其中,所述第一语料数据为包含有目标对象的第一名称 5 CN 111581950 A 说 明 书 2/25 页 词的数据,所述第二语料数据为与所述第一语料数据关联的数据;预处理模块,用于根据预 设的处理规则,对所述第一语料数据和所述第二语料数据分别进行基于自然语言理解的多 组预设处理,得到处理后的第一语料数据和处理后的第二语料数据;第一确定模块,用于根 据所述处理后的第一语料数据和所述处理后的第二语料数据,确定文本数据的正则表达 式,以及文本数据与目标对象的第一名称词之间的关系参数;第二确定模块,用于根据所述 文本数据的正则表达式,以及所述文本数据与目标对象的第一名称词之间的关系参数,从 所述第一语料数据和所述第二语料数据中确定出目标对象的同义名称词。 一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器 执行所述指令时实现获取目标对象的第一名称词、第一语料数据,以及第二语料数据,其 中,所述第一语料数据为包含有目标对象的第一名称词的数据,所述第二语料数据为与所 述第一语料数据关联的数据;根据预设的处理规则,对所述第一语料数据和所述第二语料 数据分别进行基于自然语言理解的多组预设处理,得到处理后的第一语料数据和处理后的 第二语料数据;根据所述处理后的第一语料数据和所述处理后的第二语料数据,确定文本 数据的正则表达式,以及文本数据与目标对象的第一名称词之间的关系参数;根据所述文 本数据的正则表达式,以及所述文本数据与目标对象的第一名称词之间的关系参数,从所 述第一语料数据和所述第二语料数据中确定出目标对象的同义名称词。 一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现获取 目标对象的第一名称词、第一语料数据,以及第二语料数据,其中,所述第一语料数据为包 含有目标对象的第一名称词的数据,所述第二语料数据为与所述第一语料数据关联的数 据;根据预设的处理规则,对所述第一语料数据和所述第二语料数据分别进行基于自然语 言理解的多组预设处理,得到处理后的第一语料数据和处理后的第二语料数据;根据所述 处理后的第一语料数据和所述处理后的第二语料数据,确定文本数据的正则表达式,以及 文本数据与目标对象的第一名称词之间的关系参数;根据所述文本数据的正则表达式,以 及所述文本数据与目标对象的第一名称词之间的关系参数,从所述第一语料数据和所述第 二语料数据中确定出目标对象的同义名称词。 本说明书提供的同义名称词的确定方法和同义名称词的知识库的建立方法,通过 先获取包含有目标对象的第一名称词的第一语料数据,以及与第一语料数据关联的第二语 料数据;再通过根据预设的处理规则对上述语料数据进行基于自然语言理解的多组预设处 理,得到处理后的语料数据;进而可以利用上述处理后的语料数据,通过确定并综合利用文 本数据的正则表达式,以及文本数据与目标对象的第一名称词之间的关系参数这两种不同 维度的参数数据,来挖掘确定出目标对象的同义名称词。从而能够有效地避免出现遗漏,较 为准确、全面地挖掘出目标对象的同义名称词。 附图说明 为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单 地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人 员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 图1是应用本说明书实施例提供的同义名称词的确定方法的系统结构组成的一个 实施例的示意图; 6 CN 111581950 A 说 明 书 3/25 页 图2是在一个场景示例中,应用本说明书实施例提供的同义名称词的确定方法的 一种实施例的示意图; 图3是在一个场景示例中,应用本说明书实施例提供的同义名称词的确定方法的 一种实施例的示意图; 图4是在一个场景示例中,应用本说明书实施例提供的同义名称词的确定方法的 一种实施例的示意图; 图5是本说明书的一个实施例提供的同义名称词的确定方法的流程示意图; 图6是本说明书的一个实施例提供的同义名称词的知识库的建立方法的流程示意 图; 图7是本说明书的一个实施例提供的服务器的结构组成示意图; 图8是本说明书的一个实施例提供的同义名称词的确定装置的结构组成示意图。