技术摘要:
本申请提供一种要素提取方法、装置、电子设备及存储介质,用于改善难以有效地从刑事判决书中抽取到判决结果要素的问题。该方法包括:获得刑事判决书;从刑事判决书中提取至少一个当事人名称;从刑事判决书中筛选出与至少一个当事人名称对应的内容区块,获得至少一个内 全部
背景技术:
判决书,是指法院对审理结束的案件作出的裁决的具有法律效力文书;常见的判 决书大概包括两类:民事判决书和刑事判决书;判决书中包括对当事人的判决结果,其中, 当事人包括原告当事人和被告当事人,判决结果由许多结果要素构成,这里的结果要素例 如:被告人名称、是否有罪、成立罪名、主刑类型、刑期和罚金等等。 目前对判决书进行要素提取的方法只能实现从判决书中获取部分指定信息,具体 例如:检索判决书中是否有数值,将数值确定为罚金;根据判决书的身份性质将判决书进行 分类筛选出民事判决书,再根据预设格式模板从民事诉讼的判决书抽取出判决结果等等。 在具体的实践过程中发现,使用目前的方法难以有效地从刑事判决书中抽取到判决结果要 素。
技术实现要素:
本申请实施例的目的在于提供一种要素提取方法、装置、电子设备及存储介质,用 于改善难以有效地从刑事判决书中抽取到判决结果要素的问题。 本申请实施例提供了一种要素提取方法,包括:获得刑事判决书;从刑事判决书中 提取至少一个当事人名称;从刑事判决书中筛选出与至少一个当事人名称对应的内容区 块,获得至少一个内容区块;使用预设结构化抽取模型从至少一个内容区块中的每个内容 区块中提取判决结果要素。在上述的实现过程中,通过先刑事判决书中提取当事人名称,再 根据当事人的名称将刑事判决书切块划分为至少一个内容区块,使用预设结构化抽取模型 从每个内容区块中提取判决结果要素;也就是说,先提取当事人名称,再提取与当事人的名 称对应的判决结果要素,有效地提取到了与当事人的名称有关的判决结果要素,从而改善 了难以有效地从刑事判决书中抽取到判决结果要素的问题。 可选地,在本申请实施例中,获得刑事判决书,包括:获得多个判决书;从多个判决 书中筛选出至少一个刑事判决书。在上述的实现过程中,通过获得多个判决书;并从多个判 决书中筛选出至少一个刑事判决书;从而减少了对无效数据的计算,有效地提高了对判决 书的分析和提取速度。 可选地,在本申请实施例中,从刑事判决书中提取至少一个当事人名称,包括:提 取刑事判决书中的多个当事人名称;对多个当事人名称进行分组合并,获得至少一个当事 人名称。在上述的实现过程中,通过提取刑事判决书中的多个当事人名称;并对多个当事人 名称进行分组合并,获得至少一个当事人名称;从而有效地提高了获得当事人的速度,并通 过当事人来提取判决结果要素简化了提取运算。 可选地,在本申请实施例中,从刑事判决书中筛选出与至少一个当事人名称对应 4 CN 111597803 A 说 明 书 2/13 页 的内容区块,包括:根据段落标记对刑事判决书进行分段,获得多个划分段落;判断多个划 分段落中的每个划分段落是否包括当事人名称;若是,则将划分段落加入当事人名称对应 的内容区块。在上述的实现过程中,通过根据段落标记对刑事判决书进行分段,获得多个划 分段落;若多个划分段落中的每个划分段落包括当事人名称,则将划分段落加入当事人名 称对应的内容区块;从而有效地提高了获得当事人名称对应内容区块的准确率,即从内容 区块中提取判决结果要素的准确率。 可选地,在本申请实施例中,预设结构化抽取模型包括:第一抽取表达式集合和第 二抽取表达式集合,判决结果要素包括:总罪结果要素和分罪结果要素;使用预设结构化抽 取模型从至少一个内容区块中的每个内容区块中提取判决结果要素,包括:判断刑事判决 书中是否包括分罪结果要素;若是,则使用第一抽取表达式集合从至少一个内容区块中的 每个内容区块中提取总罪结果要素,并使用第二抽取表达式集合从至少一个内容区块中的 每个内容区块中提取分罪结果要素;若否,则使用第一抽取表达式集合从至少一个内容区 块中的每个内容区块中提取总罪结果要素。 在上述的实现过程中,若刑事判决书中包括分罪结果要素,则抽取总罪结果要素 和分罪结果要素;若刑事判决书中不包括分罪结果要素,则仅抽取总罪结果要素;从而有效 地提高了提取包括总罪和分罪的判决结果要素的完整度,同时也提高了获得判决结果要素 的速度。 可选地,在本申请实施例中,获得刑事判决书,包括:接收终端设备发送的刑事判 决书;在使用预设结构化抽取模型从至少一个内容区块中的每个内容区块中提取判决结果 要素之后,还包括:向终端设备发送判决结果要素。在上述的实现过程中,通过接收终端设 备发送的刑事判决书;在使用预设结构化抽取模型从至少一个内容区块中的每个内容区块 中提取判决结果要素之后,还从而有效地提高了终端设备获得判决结果要素的速度。 可选地,在本申请实施例中,在使用预设结构化抽取模型从至少一个内容区块中 的每个内容区块中提取判决结果要素之后,还包括:根据判决结果要素构建刑事关系知识 图谱;使用刑事关系知识图谱分析刑事判决书的人物关系图;向终端设备发送人物关系图。 在上述的实现过程中,通过根据判决结果要素构建刑事关系知识图谱;使用刑事关系知识 图谱分析刑事判决书的人物关系图;向终端设备发送人物关系图;从而提高了终端设备有 效地获得与当事人有关的人物关系图。 本申请实施例还提供了一种要素提取装置,包括:判决书获得模块,用于获得刑事 判决书;判决书提取模块,用于从刑事判决书中提取至少一个当事人名称;内容区块获得模 块,用于从刑事判决书中筛选出与至少一个当事人名称对应的内容区块,获得至少一个内 容区块;结果要素提取模块,用于使用预设结构化抽取模型从至少一个内容区块中的每个 内容区块中提取判决结果要素。 可选地,在本申请实施例中,判决书获得模块,包括:第一获得模块,用于获得多个 判决书;判决书筛选模块,用于从多个判决书中筛选出至少一个刑事判决书。 可选地,在本申请实施例中,判决书提取模块,包括;名称提取模块,用于提取刑事 判决书中的多个当事人名称;名称获得模块,用于对多个当事人名称进行分组合并,获得至 少一个当事人名称。 可选地,在本申请实施例中,内容区块获得模块,包括:划分段落获得模块,用于根 5 CN 111597803 A 说 明 书 3/13 页 据段落标记对刑事判决书进行分段,获得多个划分段落;划分段落判断模块,用于判断多个 划分段落中的每个划分段落是否包括当事人名称;划分段落加入模块,用于若多个划分段 落中的每个划分段落包括当事人名称,则将划分段落加入当事人名称对应的内容区块。 可选地,在本申请实施例中,判决书获得模块,包括:判决书接收模块,用于接收终 端设备发送的刑事判决书;要素提取装置,还包括:结果要素发送模块,用于向终端设备发 送判决结果要素。 可选地,在本申请实施例中,要素提取装置,还包括:知识图谱构建模块,用于根据 判决结果要素构建刑事关系知识图谱;人物关系分析模块,用于使用刑事关系知识图谱分 析刑事判决书的人物关系图;人物关系发送模块,用于向终端设备发送人物关系图。 本申请实施例还提供了一种电子设备,包括:处理器和存储器,存储器存储有处理 器可执行的机器可读指令,机器可读指令被处理器执行时执行如上面描述的方法。 本申请实施例还提供了一种存储介质,该存储介质上存储有计算机程序,该计算 机程序被处理器运行时执行如上面描述的方法。 附图说明 为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使 用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看 作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他相关的附图。 图1示出的本申请实施例提供的要素提取方法的流程示意图; 图2示出的本申请实施例提供的预设结构化抽取模型的示例图; 图3示出的本申请实施例提供的电子设备与终端设备进行交互方法的流程示意 图; 图4示出的本申请实施例提供的人物关系图分析方法的流程示意图; 图5示出的本申请实施例提供的要素提取装置的结构示意图; 图6示出的本申请实施例提供的电子设备的结构示意图。