技术摘要:
本申请公开了知识抽取方法、装置、设备及存储介质,涉及大数据技术。具体实现方案为:根据用户在第一页面中输入的信息获取字段的名称和字段的设置信息,设置信息用于进行针对字段的知识抽取;根据用户在第二页面中输入的信息创建知识抽取任务;知识抽取任务包括字段和 全部
背景技术:
知识图谱的构建基于知识的抽取或知识的挖掘。当前,知识抽取主要基于神经网 络的机器学习实现。 神经网络模型需要基于样本数据预先训练,神经网络模型的运行效果与样本数据 的数量和准确性密切相关。训练前期缺乏标注数据,通常通过人工标注的方式获取样本数 据,这就增大了知识抽取的人工成本,而且效率较低。
技术实现要素:
提供了一种知识抽取方法、装置、设备及存储介质,降低了知识抽取的人工成本, 提升了知识抽取的效率。 根据第一方面,提供了一种知识抽取方法,包括: 根据用户在第一页面中输入的信息获取字段的名称和所述字段的设置信息,所述 设置信息用于进行针对所述字段的知识抽取; 根据所述用户在第二页面中输入的信息创建知识抽取任务;所述知识抽取任务包 括所述字段和待处理文档,所述知识抽取任务用于根据所述设置信息对所述待处理文档进 行针对所述字段的知识抽取; 执行所述知识抽取任务,获得知识抽取答案; 输出所述知识抽取答案。 可以看出,与现有技术不同的是,本申请实施例中,通过用户在第一页面中输入的 信息可以获取字段的名称和字段的设置信息,通过用户在第二页面中输入的信息可以创建 知识抽取任务,知识抽取任务用于根据字段的设置信息对待处理文档进行针对该字段的知 识抽取,从而,执行知识抽取任务,获得并输出知识抽取答案。本申请提供的知识抽取方法, 相比于现有技术,没有使用神经网络模型实现知识抽取,而是通过字段的设置信息实现对 文档的知识抽取,避免了使用神经网络模型时需要预先获取训练样本和预先训练模型的过 程,降低了人工成本,缩短了准备时间,提升了知识抽取的效率。 根据第二方面,提供了一种知识抽取装置,包括: 获取模块,用于根据用户在第一页面中输入的信息获取字段的名称和所述字段的 设置信息,所述设置信息用于进行针对所述字段的知识抽取; 创建模块,用于根据所述用户在第二页面中输入的信息创建知识抽取任务;所述 知识抽取任务包括所述字段和待处理文档,所述知识抽取任务用于根据所述设置信息对所 述待处理文档进行针对所述字段的知识抽取; 处理模块,用于执行所述知识抽取任务,获得知识抽取答案; 输出模块,用于输出所述知识抽取答案。 5 CN 111581363 A 说 明 书 2/11 页 根据第三方面,提供了一种电子设备,包括: 至少一个处理器;以及 与所述至少一个处理器通信连接的存储器;其中, 所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一 个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的方法。 根据第四方面,提供了存储有计算机指令的非瞬时计算机可读存储介质,所述计 算机指令用于使所述计算机执行上述第一方面所述的方法。 上述申请中的一个实施例具有如下优点或有益效果:通过用户在第一页面中输入 的信息可以获取字段的名称和字段的设置信息,通过用户在第二页面中输入的信息可以创 建知识抽取任务,知识抽取任务用于根据字段的设置信息对待处理文档进行针对该字段的 知识抽取,从而,执行知识抽取任务,获得并输出知识抽取答案,降低了人工成本,提升了知 识抽取的效率。 应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特 征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。 附图说明 附图用于更好地理解本方案,不构成对本申请的限定。其中: 图1为本申请实施例适用的应用场景图; 图2为本申请实施例提供的知识抽取方法的一种流程图; 图3为本申请实施例提供的知识抽取方法的另一种流程图; 图4为本申请实施例提供的第一页面的示意图; 图5为本申请实施例提供的知识抽取装置的一种结构示意图; 图6为本申请实施例提供的电子设备的一种结构示意图。