logo好方法网

风险识别方法、装置、电子设备及可读存储介质


技术摘要:
本公开实施例公开了一种风险识别方法、装置、电子设备及可读存储介质,该风险识别方法包括:获取样本数据以及待识别事件,其中,所述样本数据包括多个事件,每个所述事件与一个或多个特征相关联,所述待识别事件与一个或多个目标特征相关联;至少基于所述样本数据中与  全部
背景技术:
目前,在响应用户的业务处理请求的过程中主要通过对数字类信息的匹配核实来 进行风险识别,比如通过验证信用卡卡号、有效期、手机号码、证件号码等来判断当前的待 识别事件是否存在风险。然而,本发明人发现,现有技术中存在风险识别不准确的问题。
技术实现要素:
为了解决相关技术中的问题,本公开实施例提供一种风险识别方法、装置、电子设 备及可读存储介质。 第一方面,本公开实施例中提供了一种风险识别方法。 具体地,所述风险识别方法,包括: 获取样本数据以及待识别事件,其中,所述样本数据包括多个事件,每个所述事件 与一个或多个特征相关联,所述待识别事件与一个或多个目标特征相关联; 至少基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事 件的数量,确定所述目标特征的风险关联参数; 基于所述目标特征的风险关联参数,确定所述待识别事件的风险。 结合第一方面,本公开在第一方面的第一种实现方式中,所述获取样本数据,包 括: 获取原始数据,所述原始数据包括多个事件以及所述事件是否为风险事件的标 识,每个所述事件与一个或多个原始特征相关联; 基于所述原始特征获取新增特征; 将所述新增特征与相应事件相关联,并将所述新增特征加入所述原始数据,以获 取所述样本数据。 结合第一方面的第一种实现方式,本公开在第一方面的第二种实现方式中,所述 基于所述原始特征以获取新增特征,包括: 将多个原始特征组合为新增特征;以及/或者 通过模糊化的方式处理所述原始特征以获取新增特征。 结合第一方面,本公开在第一方面的第三种实现方式中,所述风险关联参数包括 第一风险关联参数,所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数 量和非风险事件的数量,确定所述目标特征的风险关联参数,包括: 基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的 数量,确定所述目标特征的第一风险关联参数。 结合第一方面的第三种实现方式,本公开在第一方面的第四种实现方式中,该方 4 CN 111582722 A 说 明 书 2/20 页 法还包括: 基于所述样本数据中与所述目标特征相关联的风险事件的数量和非风险事件的 数量,确定所述目标特征的第一风险关联参数的第一置信度, 其中,所述基于所述目标特征的风险关联参数,确定所述待识别事件的风险,包 括:基于所述目标特征的第一风险关联参数和所述第一置信度,确定所述待识别事件的风 险。 结合第一方面,本公开在第一方面的第五种实现方式中,所述风险关联参数包括 第二风险关联参数,所述至少基于所述样本数据中与所述目标特征相关联的风险事件的数 量和非风险事件的数量,确定所述目标特征的风险关联参数,包括: 基于与所述目标特征相关联的风险事件的数量和非风险事件的数量确定筛选条 件; 基于所述样本数据中满足所述筛选条件的特征数量,确定所述目标特征的第二风 险关联参数。 结合第一方面的第五种实现方式,本公开在第一方面的第六种实现方式中: 所述筛选条件包括第一筛选条件和第二筛选条件,所述第一筛选条件包括风险事 件的数量与所述目标特征的风险事件数量的差值为第一预设值且非风险事件的数量与所 述目标特征的非风险事件数量的差值为第二预设值,所述第二筛选条件包括风险事件的数 量与所述目标特征的风险事件数量的差值为第二预设值且非风险事件的数量与所述目标 特征的非风险事件数量的差值为第一预设值; 基于所述样本数据中满足所述筛选条件的特征数量,确定所述目标特征的第二风 险关联参数,包括基于所述样本数据中满足所述第一筛选条件的特征数量和满足所述第二 筛选条件的特征数量,确定所述目标特征的第二风险关联参数。 结合第一方面的第五种实现方式,本公开在第一方面的第七种实现方式中,该方 法还包括: 基于所述样本数据中满足所述筛选条件的特征数量,确定所述目标特征的第二风 险关联参数的第二置信度, 其中,所述基于所述目标特征的风险关联参数,确定所述待识别事件的风险,包 括:基于所述目标特征的第二风险关联参数和所述第二置信度,确定所述待识别事件的风 险。 结合第一方面,本公开在第一方面的第八种实现方式中,所述风险关联参数包括 第一风险关联参数和第二风险关联参数,所述基于所述目标特征的风险关联参数,确定所 述待识别事件的风险,包括: 基于所述第一风险关联参数、所述第二风险关联参数、所述第一风险关联参数的 第一置信度以及所述第二风险关联参数的第二置信度确定所述目标特征的第一风险概率; 基于与所述待识别事件相关联的多个目标特征各自的第一风险概率确定所述待 识别事件的第二风险概率; 基于所述待识别事件的第二风险概率,确定所述待识别事件的风险。 结合第一方面,本公开在第一方面的第九种实现方式中,所述基于所述目标特征 的风险关联参数,确定所述待识别事件的风险,包括: 5 CN 111582722 A 说 明 书 3/20 页 基于所述目标特征的风险关联参数和至少一个与所述待识别事件的场景相关的 预设特征,使用训练好的第一模型,确定所述待识别事件的风险,所述第一模型是使用样本 数据的风险关联参数和预设特征训练得到的。 结合第一方面,本公开在第一方面的第十种实现方式中,该方法还包括: 根据所述待识别事件的实际业务处理结果,将所述待识别事件分类为风险事件或 非风险事件; 将所述待识别事件加入所述样本数据。 结合第一方面,本公开在第一方面的第十一种实现方式中,该方法还包括: 在确定所述待识别事件为高风险事件的情况下,基于所述目标特征输出按照预设 维度组织与所述事件相关的描述信息而得到的解释信息。 结合第一方面,本公开在第一方面的第十二种实现方式中,该方法还包括: 基于所述待识别事件的风险识别结果,使用训练好的第二模型,确定针对所述待 识别事件的业务决策,所述第二模型是使用样本事件的风险识别结果、针对所述样本事件 的样本业务决策和针对所述样本事件采取所述样本业务决策后得到的结果训练得到的。 第二方面,本公开实施例中提供了一种风险识别装置。 具体地,所述风险识别装置,包括: 获取模块,被配置为获取样本数据以及待识别事件,其中,所述样本数据包括多个 事件,每个所述事件与一个或多个特征相关联,所述待识别事件与一个或多个目标特征相 关联; 第一确定模块,被配置为至少基于所述样本数据中与所述目标特征相关联的风险 事件的数量和非风险事件的数量,确定所述目标特征的风险关联参数; 第二确定模块,被配置为基于所述目标特征的风险关联参数,确定所述待识别事 件的风险。 结合第二方面,本公开在第二方面的第一种实现方式中,所述获取模块包括: 第一获取子模块,被配置为获取原始数据,所述原始数据包括多个事件以及所述 事件是否为风险事件的标识,每个所述事件与一个或多个原始特征相关联; 第二获取子模块,被配置为基于所述原始特征获取新增特征; 第三获取子模块,被配置为将所述新增特征与相应事件相关联,并将所述新增特 征加入所述原始数据,以获取所述样本数据。 结合第二方面的第一种实现方式,本公开在第二方面的第二种实现方式中,所述 第二获取子模块被配置为: 将多个原始特征组合为新增特征;以及/或者 通过模糊化的方式处理所述原始特征以获取新增特征。 结合第二方面,本公开在第二方面的第三种实现方式中,所述风险关联参数包括 第一风险关联参数,所述第一确定模块包括: 第一确定子模块,被配置为基于所述样本数据中与所述目标特征相关联的风险事 件的数量和非风险事件的数量,确定所述目标特征的第一风险关联参数。 结合第二方面的第三种实现方式,本公开在第二方面的第四种实现方式中,该装 置还包括: 6 CN 111582722 A 说 明 书 4/20 页 第三确定模块,被配置为基于所述样本数据中与所述目标特征相关联的风险事件 的数量和非风险事件的数量,确定所述目标特征的第一风险关联参数的第一置信度, 其中,所述第二确定模块被配置为基于所述目标特征的第一风险关联参数和所述 第一置信度,确定所述待识别事件的风险。 结合第二方面,本公开在第二方面的第五种实现方式中,所述风险关联参数包括 第二风险关联参数,所述第一确定模块包括: 第二确定子模块,被配置为基于与所述目标特征相关联的风险事件的数量和非风 险事件的数量确定筛选条件; 第三确定子模块,被配置为基于所述样本数据中满足所述筛选条件的特征数量, 确定所述目标特征的第二风险关联参数。 结合第二方面的第五种实现方式,本公开在第二方面的第六种实现方式中: 所述筛选条件包括第一筛选条件和第二筛选条件,所述第一筛选条件包括风险事 件的数量与所述目标特征的风险事件数量的差值为第一预设值且非风险事件的数量与所 述目标特征的非风险事件数量的差值为第二预设值,所述第二筛选条件包括风险事件的数 量与所述目标特征的风险事件数量的差值为第二预设值且非风险事件的数量与所述目标 特征的非风险事件数量的差值为第一预设值; 所述第三确定子模块被配置为基于所述样本数据中满足所述第一筛选条件的特 征数量和满足所述第二筛选条件的特征数量,确定所述目标特征的第二风险关联参数。 结合第二方面的第五种实现方式,本公开在第二方面的第七种实现方式中,该装 置还包括: 第四确定模块,被配置为基于所述样本数据中满足所述筛选条件的特征数量,确 定所述目标特征的第二风险关联参数的第二置信度, 其中,所述第二确定模块被配置为基于所述目标特征的第二风险关联参数和所述 第二置信度,确定所述待识别事件的风险。 结合第二方面,本公开在第二方面的第八种实现方式中,所述风险关联参数包括 第一风险关联参数和第二风险关联参数,所述第二确定模块包括: 第四确定子模块,被配置为基于所述第一风险关联参数、所述第二风险关联参数、 所述第一风险关联参数的第一置信度以及所述第二风险关联参数的第二置信度确定所述 目标特征的第一风险概率; 第五确定子模块,被配置为基于与所述待识别事件相关联的多个目标特征各自的 第一风险概率确定所述待识别事件的第二风险概率; 第六确定子模块,被配置为基于所述待识别事件的第二风险概率,确定所述待识 别事件的风险。 结合第二方面,本公开在第二方面的第九种实现方式中,所述第二确定模块包括: 第七确定子模块,被配置为基于所述目标特征的风险关联参数和至少一个与所述 待识别事件的场景相关的预设特征,使用训练好的第一模型,确定所述待识别事件的风险, 所述第一模型是使用样本数据的风险关联参数和预设特征训练得到的。 结合第二方面,本公开在第二方面的第十种实现方式中,该装置还包括: 分类模块,被配置为根据所述待识别事件的实际业务处理结果,将所述待识别事 7 CN 111582722 A 说 明 书 5/20 页 件分类为风险事件或非风险事件; 更新模块,被配置为将所述待识别事件加入所述样本数据。 结合第二方面,本公开在第二方面的第十一种实现方式中,该装置还包括: 输出模块,被配置为在确定所述待识别事件为高风险事件的情况下,基于所述目 标特征输出按照预设维度组织与所述事件相关的描述信息而得到的解释信息。 结合第二方面,本公开在第二方面的第十二种实现方式中,该装置还包括: 决策模块,被配置为基于所述待识别事件的风险识别结果,使用训练好的第二模 型,确定针对所述待识别事件的业务决策,所述第二模型是使用样本事件的风险识别结果、 针对所述样本事件的样本业务决策和针对所述样本事件采取所述样本业务决策后得到的 结果训练得到的。 第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述 存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器 执行以实现如第一方面、第一方面的第一种实现方式至第十二种实现方式中任一项所述的 方法。 第四方面,本公开实施例中提供了一种计算机可读存储介质,其上存储有计算机 指令,该计算机指令被处理器执行时实现如第一方面、第一方面的第一种实现方式至第十 二种实现方式中任一项所述的方法。 根据本公开实施例提供的技术方案,通过获取样本数据以及待识别事件,其中,所 述样本数据包括多个事件,每个所述事件与一个或多个特征相关联,所述待识别事件与一 个或多个目标特征相关联;至少基于所述样本数据中与所述目标特征相关联的风险事件的 数量和非风险事件的数量,确定所述目标特征的风险关联参数;基于所述目标特征的风险 关联参数,确定所述待识别事件的风险,能够较为准确地识别待识别事件的风险。 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 能限制本公开。 附图说明 结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优 点将变得更加明显。在附图中: 图1示出根据本公开实施例的风险识别方法的流程图; 图2示出根据本公开实施例的获取样本数据的流程图; 图3示出根据本公开实施例的确定待识别事件的风险的流程图; 图4示出根据本公开另一实施例的风险识别方法的流程图; 图5示出根据本公开实施例的风险识别装置的结构框图; 图6示出根据本公开实施例的获取模块的结构框图; 图7示出根据本公开实施例的第二确定模块的结构框图; 图8示出根据本公开实施例的电子设备的结构框图;以及 图9示出根据本公开实施例的适于实现风险识别方法的计算机系统的结构示意 图。 8 CN 111582722 A 说 明 书 6/20 页
下载此资料需消耗2积分,
分享到:
收藏