技术摘要:
本发明公开了一种基于客群定位的风险策略生成方法、装置及电子设备,所述方法包括:根据用户属性对用户进行客群定位分类;分别从各个客群定位分类中选择训练集和测试集,并对所述训练集和所述测试集中的变量进行处理;创建并通过变量处理后的各个训练集训练所述风险策 全部
背景技术:
现有征信体系不够完善,出现大部分人群的征信记录不完全,信用资料缺乏的现 象,导致无法准确的解决这些人的授信问题。一方面,商业银行难以覆盖到这类人群并为其 提供金融服务;另一方面,金融科技的快速发展,加快了普惠金融的步伐。各互联网金融机 构、小贷公司通过让用户提交各类材料,现场或者电话交谈来判断用户的资金需求的真实 性及偿还能力,这在一定程度上解决了无信用记录的金融服务对象的授信问题。但这种方 式中通常采用简单的风险策略,比如查询客户信用记录被查询的次数、性别等通过这些策 略来判断和识别客户的金融风险。 但在实际操作中,这种简单的风险策略存在一些弊端和缺陷:1、用户填写资料可 能会造假,核实人力成本和难度均较大;2、存在用户户享受到金融服务后将相关财产变卖 转移的风险;3、在真实的应用场景中人群也会不稳定带来策略的不稳定性。因此,这种简单 的风险策略对风险的预测性和准确性很有限,可能会错过优质客户,接纳低质客户。
技术实现要素:
本发明旨在解决现有风险策略设计简单,对风险的预测性和准确性低的问题。 为了解决上述技术问题,本发明第一方面提出一种基于客群定位的风险策略生成 方法,所述方法包括: 根据用户属性对用户进行客群定位分类; 分别从各个客群定位分类中选择训练集和测试集,并对所述训练集和所述测试集 中的变量进行处理; 创建并通过变量处理后的各个训练集训练所述风险策略模型,计算所述风险策略 模型的第一KS曲线; 基于测试集验证所述风险策略模型的第二KS曲线; 当所述第一KS曲线和所述第二KS曲线满足预设条件时,采用所述风险策略模型生 成用户风险策略。 根据本发明一种较佳的实施方式,所述对所述训练集和所述测试集中的变量进行 处理包括: 基于变量重要性及变量分布稳定性进行变量筛选。 根据本发明一种较佳的实施方式,所述基于变量重要性及变量分布稳定性进行变 量筛选包括: 基于IV法选择所述训练集和所述测试集的自变量中定性变量对因变量影响最显 著的第一指标。 4 CN 111583017 A 说 明 书 2/8 页 根据本发明一种较佳的实施方式,所述基于变量重要性及变量分布稳定性进行变 量筛选还包括: 基于Boruta法选择所述训练集和所述测试集的自变量中对因变量影响最显著的 第二指标。 根据本发明一种较佳的实施方式,所述对所述训练集和所述测试集中的变量进行 处理之后,所述方法还包括: 将所述训练集和所述测试集中的第一指标和所述第二指标生成对应的变量处理 后的训练集和测试集。 根据本发明一种较佳的实施方式,所述用户属性包括用户基本信息、用户借款信 息、用户存款信息中的至少一种。 根据本发明一种较佳的实施方式,所述风险策略模型为Logistic回归模型或XGB 模型。 为了解决上述技术问题,本发明第二方面提供一种基于客群定位的风险策略生成 装置,所述装置包括: 分类模块,用于根据用户属性对用户进行客群定位分类; 变量处理模块,用于分别从各个客群定位分类中选择训练集和测试集,并对所述 训练集和所述测试集中的变量进行处理; 第一计算模块,用于创建并通过变量处理后的各个训练集训练所述风险策略模 型,计算所述风险策略模型的第一KS曲线; 第二计算模块,用于基于测试集验证所述风险策略模型的第二KS曲线; 生成模块,用于当所述第一KS曲线和所述第二KS曲线满足预设条件时,采用所述 风险策略模型生成用户风险策略。 根据本发明一种较佳的实施方式,所述变量处理模块具体用于基于变量重要性及 变量分布稳定性进行变量筛选。 根据本发明一种较佳的实施方式,所述变量处理模块包括: 第一选择模块,用于基于IV法选择所述训练集和所述测试集的自变量中定性变量 对因变量影响最显著的第一指标。 根据本发明一种较佳的实施方式,所述变量处理模块还包括: 第二选择模块,用于基于Boruta法选择所述训练集和所述测试集的自变量中对因 变量影响最显著的第二指标。 根据本发明一种较佳的实施方式,所述变量处理模块还包括: 子生成模块,用于将所述训练集和所述测试集中的第一指标和所述第二指标生成 对应的变量处理后的训练集和测试集。 根据本发明一种较佳的实施方式,所述用户属性包括用户基本信息、用户借款信 息、用户存款信息中的至少一种。 根据本发明一种较佳的实施方式,所述风险策略模型为Logistic回归模型或XGB 模型。 为解决上述技术问题,本发明第三方面提供一种电子设备,包括: 处理器;以及 5 CN 111583017 A 说 明 书 3/8 页 存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理 器执行上述的方法。 为了解决上述技术问题,本发明第四方面提出一种计算机可读存储介质,其中,所 述计算机可读存储介质存储一个或多个程序,当所述一个或多个程序被处理器执行时,实 现上述方法。 本发明根据用户属性对用户进行客群定位分类;基于客群定位分类进行变量处 理,再建立风险策略模型,将区分度最大的变量用于区分客群,一方面可以避免一个变量对 整个风险策略模型的贡献性过强,导致风险策略模型的稳定性太差。同时可以让更多“长 尾”的变量引入风险策略模型中,提高风险策略模型的预测性。本发明基于客群定位建立风 险策略模型,让风险策略模型在每个客群中选择不同的评估方法,能够有效的提高模型的 预测力,同时对客群的风险识别度会更加的精准。 附图说明 为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚, 下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本 发明的示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下, 可以根据这些附图获得其他实施例的附图。 图1是本发明一种基于客群定位的风险策略生成方法的流程示意图; 图2是本发明中某个用户对不同价格的接受概率图; 图3是本发明中随机抽取的10个用户对不同价格的接受概率图; 图4a是本发明本发明对某一用户描绘的利率敏感度曲线; 图4b本发明在相同动支概率情况下对图4a的建议定价Psug加价后模拟动支概率 的变化示意图; 图5是本发明一种基于客群定位的风险策略生成装置的结构框架示意图; 图6是根据本发明的一种电子设备的示例性实施例的结构框图; 图7是本发明一个计算机可读介质实施例的示意图。