logo好方法网

一种预测案件办理时长的系统与方法


技术摘要:
本发明公开了一种预测案件办理时长的系统,包括包括案件信息获取模块、案件时长预测模块、结果输出模块;所述案件信息获取模块用于获取待预测的新案件数据,所述待预测新案件数据包括移送案由、犯罪主体、嫌疑人作案时年龄、是否网络犯罪、涉案金额、是否涉黑;所述案  全部
背景技术:
人民检察院办理的司法案件与当事人的利益密切相关,然而目前对于具体的案 件,案件本身的情况,负责办理案件的检察官的行为,以及案件实际需要的流程等都会影响 到案件的实际处理时间,现阶段还没有成熟的技术方案可以根据具体的案件情况,预估一 个相对准确的处理时间,这使得案件相关人员在工作安排方面存在很大的变数。
技术实现要素:
本发明所要解决的技术问题是:提供一种预测案件办理时长的系统与方法。 为解决上述技术问题,本发明所采用的技术方案是: 一种预测案件办理时长的系统,其特征在于,包括案件信息获取模块、案件时长预 测模块、结果输出模块; 所述案件信息获取模块用于获取待预测的新案件数据,所述待预测新案件数据包 括移送案由、犯罪主体、嫌疑人作案时年龄、是否网络犯罪、涉案金额、是否涉黑; 所述案件时长预测模块用于根据待预测的新案件数据计算预测案件需要办理的 时长; 所述结果输出模块用于将预测结果通过语音、文字或图示的方式输出。 与现有技术相比,本发明具有如下技术效果:本发明能够准确对新案件的办理时 长进行预测,实现检察官绩效评估提供数据支持。 在上述技术方案的基础上,本发明还可以做如下改进。 优选地,所述还包括延期预测模块和退查预测模块, 所述延期预测模块和退查预测模块均为利用GBDT  (GradientBoostingDecisionTree)梯度提升迭代决策树算法建立的二分类模型,所述延期 预测模块和退查预测模块的输出端连接案件时长预测模块的输入端。 采用上述进一步方案的有益效果是,将检察官的行为也考虑进来,对办案时长的 预测更佳准确。 优选地,所述案件时长预测模块是经模型训练模块训练而得,所述模型训练模块 包括数据获取模块、数据预处理模块、特征选择模块、算法模型模块、数据训练模块及模型 输出模块; 所述数据获取模块用于获取历史案件的信息数据,所述历史案件用作训练样本或 测试样本;用作训练样本的历史案件集合起来组成训练样本集,用作测试样本的历史案件 集合起来组成测试样本集; 所述数据预处理模块用于对数据获取模块输入的数据进行预处理,包括对数值型 4 CN 111598319 A 说 明 书 2/5 页 变量进行缺失值填充、异常判断及排除、数据格式变换; 所述特征选择模块通过分析案件相关信息数据与案件办理时长之间的相关性,给 每个信息数据赋予一个代表相关性的特征值;并使用方差选择法、相关系数法、卡方检验、 最大信息系数法或递归特征消除法从所有信息数据中选择一定比例的信息数据作为预测 案件办理时长的特征参数; 所述算法模型模块提供至少两个待选算法模型; 所述数据训练模块根据待选算法模型的参数设置、输入的训练样本的特征参数、 所述延期预测模块的预测结论及所述退查预测模块的预测结论,利用算法模型计算得到训 练样本案件的预测案件时长数据;对基于同一类移送案由案件的预测案件平均办理时长与 实际的案件平均办理时长进行对比,若两者差值大于预设的阈值时,调整被训练的算法模 型的参数设置和/或训练样本的特征参数,重新计算,直到预测案件平均办理时长与实际的 案件平均办理时长的差值在预设的阈值范围之内,获得预备算法模型; 所述模型输出模块用于输出经训练调整好参数设置的预备算法模型。 采用上述进一步方案的有益效果是,所述算法模型可以在大量真实的训练数据的 训练中获得最佳的参数设置,更好的预测案件办理时长。 优选地,所述特征选择模块中,所述代表相关性的特征值为信息价值、信息增益、 基尼系数中的一种。 采用上述进一步方案的有益效果是,上述三种特征值技术成熟,能更好的表达案 件相关数据与办案时长的相关性。 优选地,所述算法模型模块提供的算法是决策树、逻辑回归或神经网络中的一种 或多种。 采用上述进一步方案的有益效果是,技术成熟,参数调整方便,可以针对预测结果 进行不断的调优处理。 优选地,还包括评估模块,所述评估模块利用非训练样本数据,采用交叉验证、调 整估计器的超参数或者通过量化指标来对预备算法模型进行验证和评估。 采用上述进一步方案的有益效果是,利用非训练样本的数据对预备算法模型进行 评估,可以检验预备算法模型在实际预测过程中的准确度是否满足设定的阈值,从而在上 线工作前提前预知算法模型的准确度。 优选地,所述评估模块根据预设的评估指标对预备算法模型进行评估;所述评估 指标包括训练样本集预测准确率、测试样本集预测准确率、曲线下面积、kappa系数中的至 少一个。 采用上述进一步方案的有益效果是,上述指标可以很好的判断预备算法模型在真 实案件中的预测情况与实际情况之间的差异,从而将预备算法模型的可靠性参数化,便于 评测。 一种预测案件办理时长的方法,基于上述预测案件办理时长的系统,其特征在于, 包括以下步骤: S1、获取待预测的新案件数据; S3、将所述待预测的新案件数据录入案件时长预测模块进行计算; S4、获得案件办理时长的预测值。 5 CN 111598319 A 说 明 书 3/5 页 与现有技术相比,本发明具有如下技术效果:本发明能够准确对新案件的办理时 长进行预测。 在上述技术方案的基础上,本方案还可以进行如下改进: 优选地,在所述步骤S1之后,步骤S3之前,还包括步骤S2: S2、将所述待预测的新案件数据录入延期预测模块和退查预测模块进行计算,获 得延期预测结论和退查预测结论; 所述步骤S3中还包括将所述延期预测结论、所述退查预测结论作为参数录入案件 时长预测模块。 采用上述进一步方案的有益效果是,加入了对检察官行为的预测,对案件整体的 处理时长预测更准确。 附图说明 图1为本发明的预测案件办理时长的系统的功能框图。 图2为办案时长箱线图; 图3为实施例中案件的各项信息之间的相关系数表; 图4为实施例中案件的主要信息的信息价值表; 图5为实施例中的本发明对某市2019年案件的办案时长预测结果情况。
下载此资料需消耗2积分,
分享到:
收藏