logo好方法网

文本相关度的确定方法、装置、存储介质及电子设备


技术摘要:
本申请公开了文本相关度的确定方法、装置、存储介质及电子设备。该方法包括:基于知识库确定与第一文本关联的第一组实体和与第二文本关联的第二组实体,知识库括由实体、实体间的关系及实体属性构成的知识表示;根据知识表示确定第一组实体与第二组实体间的实体相关度  全部
背景技术:
文本相关度也称为文本的匹配程度,在许多场景下都需要确定不同文本之  间的 相关度。例如词条搜索场景,通常在执行搜索时需要确定各个文档中的文  本与搜索查询中 词条的相关度,而后基于相关度的高低在搜索结果页面中来呈  现各个相关文档的排序。文 本相关度的确定基于对文本的理解,不仅由两个文  本的语义相似度相关,而且还与文本之 间的匹配程度相关。尤其对于长文本而  言,因存在信息弥散的问题,容易导致在计算文本 相关度时的计算结果的准确 性较低。
技术实现要素:
本申请实施例提供一种文本相关度的确定方法、装置、存储介质及电子设  备,可 以提升了文本相关度结算结果的准确性。 本申请实施例提供了一种文本相关度的确定方法,包括: 基于预设知识库确定与第一文本关联的第一组实体和与第二文本关联的  第二组 实体,所述预设知识库括由实体、实体之间的关系及实体属性构成的知  识表示; 根据所述知识表示确定所述第一组实体与所述第二组实体之间的实体相 关度; 根据所述第一文本中每个单词之间的关联关系、所述第二文本中每个单词  之间 的关联关系以及所述第一文本中单词与所述第二文本中单词之间的关联  关系,确定所述 第一文本和所述第二文本中每一单词关于其他单词的注意力  值,其中,所述注意力值用于 反映所述第一文本和所述第二文本中每一单词对 其他单词的关注度; 至少根据所述注意力值和所述实体相关度,确定所述第一文本与所述第二  文本 的文本相关度。 相应的,本申请实施例还提供了一种文本相关度的确定装置,包括: 实体确定单元,用于基于预设知识库确定与第一文本关联的第一组实体和  与第 二文本关联的第二组实体,所述预设知识库括由实体、实体之间的关系及  实体属性构成的 知识表示; 第一相关度确定单元,用于根据所述知识表示确定所述第一组实体与所述  第二 组实体之间的实体相关度; 注意力确定单元,用于根据所述第一文本中每个单词之间的关联关系、所  述第二 文本中每个单词之间的关联关系以及所述第一文本中单词与所述第二  文本中单词之间的 关联关系,确定所述第一文本和所述第二文本中每一单词关  于其他单词的注意力值,其 中,所述注意力值用于反映所述第一文本和所述第  二文本中每一单词对其他单词的关注 度; 6 CN 111553163 A 说 明 书 2/16 页 第二相关度确定单元,用于至少根据所述注意力值和所述实体相关度,确  定所述 第一文本与所述第二文本的文本相关度。 相应的,本申请实施例还提供了一种计算机可读存储介质,所述存储介质  存储有 多条指令,所述指令适于处理器进行加载,以执行如上所述的文本相关  度的确定方法。 相应的,本申请实施例还提供了一种电子设备,包括存储器,处理器及存  储在存 储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时  实现如上所述的 文本相关度的确定方法。 本申请实施例中,基于预设知识库确定与第一文本关联的第一组实体和与  第二 文本关联的第二组实体,预设知识库括由实体、实体之间的关系及实体属  性构成的知识表 示;根据知识表示确定第一组实体与第二组实体之间的实体相  关度;根据第一文本中每个 单词之间、第二文本中每个单词之间以及第一文本  中单词与第二文本中单词之间的关联 关系,确定第一文本和第二文本中每一单  词关于其他单词的注意力值;至少根据注意力值 和实体相关度,确定第一文本  与第二文本的文本相关度。本方案中,在文本相关度计算时 关注文本内、与文  本间各单词之间的关系,进而关注有用信息忽略无用信息,提升了文本 相关度  计算结果的准确性。 附图说明 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所  需要 使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请 的一些实施例, 对于本领域技术人员来讲,在不付出创造性劳动的前提下,还  可以根据这些附图获得其他 的附图。 图1是本申请实施例提供的文本相关度的确定方法的流程示意图。 图2是本申请实施例提供的模型架构示意图。 图3是本申请实施例提供的应用场景的结构示意图。 图4是本申请实施例提供的文本相关度的确定装置的结构示意图。 图5是本申请实施例提供的电子设备的结构示意图。 图6是本申请实施例提供的服务器的结构示意图。
分享到:
收藏