logo好方法网

结构化信息的生成方法、装置、电子设备和存储介质


技术摘要:
本申请公开了一种结构化信息的生成方法、装置、电子设备和存储介质,涉及自然语言处理领域的信息处理领域。具体实现方案为:获取源文本序列;将源文本序列输入行为‑评价模型,以生成源文本序列对应的结构化信息,其中,行为‑评价模型包括行为子模型和评价子模型,行  全部
背景技术:
在各个行业中,普遍存在以自然语言记录的文本,通常把这类文本定义为非结构 化文本,如财务报表、新闻、病历等等。目前,在舆情分析、传播分析、数据平台服务等应用场 景都存在结构化信息抽取的需求,即从非结构化文本中提取需要的结构化字段,如,从财务 报表中提取公司名称、从新闻中提取袭击事件的地点、从病历中提取患者的情况,等等。信 息抽取包括垂直领域信息抽取和开放领域信息抽取。 现有的结构化信息抽取方法主要针对垂直领域进行信息抽取,并且在对垂直领域 进行优化建模时,需要对训练样本集进行标注。但是,由于开放领域数据较多,使得对开放 领域的样本进行标注的成本高,并不能使得模型达到很好的效果,从而导致模型对开放领 域信息进行结构化信息抽取时,存在准确率低的问题。
技术实现要素:
本申请提供了一种用于结构化信息的生成方法的方法、装置、电子设备和存储介 质。 本申请第一方面实施例提供了一种结构化信息的生成方法,包括: 获取源文本序列; 将所述源文本序列输入行为-评价模型,以生成所述源文本序列对应的结构化信 息,其中,所述行为-评价模型包括行为子模型和评价子模型,所述行为子模型用于根据输 入的所述源文本序列生成所述源文本序列对应的结构化信息,所述评价子模型用于对所述 行为子模型进行训练。 本申请第二方面实施例提供了一种结构化信息的生成装置,包括: 获取模块,用于获取源文本序列; 生成模块,用于将所述源文本序列输入行为-评价模型,以生成所述源文本序列对 应的结构化信息,其中,所述行为-评价模型包括行为子模型和评价子模型,所述行为子模 型用于根据输入的所述源文本序列生成所述源文本序列对应的结构化信息,所述评价子模 型用于对所述行为子模型进行训练。 本申请第三方面实施例提供了一种电子设备,包括: 至少一个处理器;以及 与所述至少一个处理器通信连接的存储器;其中, 所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一 个处理器执行,以使所述至少一个处理器能够执行第一方面实施例的结构化信息的生成方 法。 6 CN 111597224 A 说 明 书 2/11 页 本申请第四方面实施例提供了一种存储有计算机指令的非瞬时计算机可读存储 介质,其特征在于,所述计算机指令用于使所述计算机执行第一方面实施例的结构化信息 的生成方法。 上述申请中的一个实施例具有如下优点或有益效果:通过获取源文本序列,将源 文本序列输入行为-评价模型,以生成源文本序列对应的结构化信息,其中,行为-评价模型 包括行为子模型和评价子模型,行为子模型用于根据输入的源文本序列生成源文本序列对 应的结构化信息,评价子模型用于对行为子模型进行训练。由此,通过行为-评价模型根据 输入的源文本序列,直接生成对应的结构化信息,实现了端到端的信息抽取,解决了开放领 域信息抽取时训练模型标注的成本高的技术问题,有效提高了结构化信息抽取的效率和准 确率。 应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特 征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。 附图说明 附图用于更好地理解本方案,不构成对本申请的限定。其中: 图1为本申请实施例一提供的结构化信息的生成方法的流程示意图; 图2为本申请实施例二提供的结构化信息的生成方法的流程示意图; 图3为本申请实施例提供的结构化信息的生成方法的示例图; 图4为本申请实施例三提供的结构化信息的生成装置的结构示意图; 图5是用来实现本申请实施例的结构化信息的生成方法的电子设备的框图。
下载此资料需消耗2积分,
分享到:
收藏