logo好方法网

基于因子分解机的APP风险评估方法、装置和电子设备


技术摘要:
本发明公开了基于因子分解机的APP风险评估方法、装置和电子设备,其中方法包括:获取与用户关联的移动终端的APP安装列表信息;根据APP安装列表信息提取APP特征和APP组合特征;将APP特征和APP组合特征进行独热编码,得到与用户关联的独热编码特征;将独热编码特征输入训  全部
背景技术:
在客户充分授权的情况下,获取客户终端应用程序(APP)相关的信息用以风险控 制是消费金融领域的一种普遍做法。对于客户APP信息的挖掘,普遍的做法是对APP进行分 类,然后通过统计客户对某一类APP的安装和使用偏好来进行客户画像。这种做法的缺点在 于APP的分类非常难以维护,因为本身很多APP兼具多重功能,难以将这些APP分到某一类。 比如某APP,既有社交属性,又有理财、支付等功能。正是因为APP数据比较重要,因此业内的 消费金融公司都会在贷前或者贷中建立APP风险模型。现有的APP风险模型一般用的是逻辑 回归或者一些集成算法,如GBDT、xgboost等。这类算法一般需要事先对特征进行一定的挖 掘,以构建有一定的区分度的变量,然后将这些变量送入模型进行模型训练。这些模型确实 能学习到特征的潜在规律并用于风险控制,但是这些模型回答不了同时有APP  a和b或者同 时拥有特征a和b时,组合特征对风险Y的贡献有多大等问题,同时这类模型的构建需 要大量特征挖掘工作,挖掘特征的投入较大且特征维护比较麻烦。
技术实现要素:
为了解决现有技术中当数据较少时无法准确预测金融风险的技术问题,本发明提 供了一种基于因子分解机的APP风险评估方法、装置、电子设备及计算机可读介质。 本发明的一方面提供一种基于因子分解机的APP风险评估方法,用于评估用户的 金融风险,包括: 获取与用户关联的移动终端的APP安装列表信息; 根据所述APP安装列表信息提取APP特征和APP组合特征; 将所述APP特征和APP组合特征进行独热编码,得到与用户关联的独热编码特征; 将所述独热编码特征输入训练好的机器学习模型,计算所述用户的风险评分。 根据本发明的优选实施方式,所述机器学习模型为因子分解机模型。 根据本发明的优选实施方式,所述根据所述APP安装列表信息提取APP特征和APP 组合特征,进一步包括: 对所述APP安装列表信息中的每个APP设定对应的特征; 将所述APP安装列表信息中的任意两个APP对应的特征进行组合,得到所述组合特 征。 根据本发明的优选实施方式,所述对所述APP安装列表信息中的每个APP设定对应 的特征,进一步包括: 将所述APP安装列表信息中的每个APP进行分类; 将所述APP安装列表信息中的同一类型的APP设定为同一个特征。 3 CN 111582645 A 说 明 书 2/10 页 根据本发明的优选实施方式,所述类型包括以下的任意一种:金融类、贷款类、理 财类、社交类、游戏类、工作类。 根据本发明的优选实施方式,所述根据所述APP安装列表信息提取APP特征和APP 组合特征,进一步包括: 根据所述用户的APP安装列表信息对该用户设置对应的特征; 将所述用户的任意两个特征进行组合,得到所述组合特征。 根据本发明的优选实施方式,所述将所述APP特征和APP组合特征进行独热编码, 得到与用户关联的独热编码特征,进一步包括: 获取多个APP的用户覆盖度; 建立APP集合,使得所述APP集合中的各APP的所述用户覆盖度大于预定值; 将用户的APP安装列表与所述APP集合比较以获得所述与用户关联的独热编码特 征。 根据本发明的优选实施方式,所述建立APP集合,使得所述APP集合中的各APP的所 述用户覆盖度大于预定值,进一步包括: 按照所述用户覆盖度由大到小的顺序对所述多个APP排序形成序列; 选取所述序列中排名在前预设数量的APP作为APP集合中的APP。 本发明的第二方面提供一种基于因子分解机的APP风险评估装置,包括: 信息获取模块,用于获取与用户关联的移动终端的APP安装列表信息; 特征提取模块,用于根据所述APP安装列表信息提取APP特征和APP组合特征; 信息编码模块,用于将所述APP特征和APP组合特征进行独热编码,得到与用户关 联的独热编码特征; 特征训练模块,用于将所述独热编码特征输入训练好的机器学习模型,计算所述 用户的风险评分。 根据本发明的优选实施方式,所述机器学习模型为因子分解机模型。 根据本发明的优选实施方式,所述特征提取模块进一步包括: 第一特征设定单元,用于对所述APP安装列表信息中的每个APP设定对应的特征; 第一特征组合单元,用于将所述APP安装列表信息中的任意两个APP对应的特征进 行组合,得到所述组合特征。 根据本发明的优选实施方式,所述第一特征设定单元进一步包括: 应用分类单元,用于将所述APP安装列表信息中的每个APP进行分类; 特征分配单元,用于将所述APP安装列表信息中的同一类型的APP设定为同一个特 征。 根据本发明的优选实施方式,所述类型包括以下的任意一种:金融类、贷款类、理 财类、社交类、游戏类、工作类。 根据本发明的优选实施方式,所述特征提取模块进一步包括: 第二特征设定单元,用于根据所述用户的APP安装列表信息对该用户设置对应的 特征; 第二特征组合单元,用于将所述用户的任意两个特征进行组合,得到所述组合特 征。 4 CN 111582645 A 说 明 书 3/10 页 根据本发明的优选实施方式,所述信息编码模块进一步包括: 覆盖度获取单元,用于获取多个APP的用户覆盖度; 集合建立单元,用于建立APP集合,使得所述APP集合中的各APP的所述用户覆盖度 大于预定值; 比较单元,用于将用户的APP安装列表与所述APP集合比较以获得所述与用户关联 的独热编码特征。 根据本发明的优选实施方式,所述集合建立单元还包括: 排序单元,用于按照所述用户覆盖度由大到小的顺序对所述多个APP排序形成序 列; 筛选单元,用于选取所述序列中排名在前预设数量的APP作为APP集合中的APP。 本发明的第三方面提供一种电子设备,其中,该电子设备包括:处理器;以及, 存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行 任一项所述的方法。 本发明的第四方面提供一种计算机可读存储介质,其中,所述计算机可读存储介 质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现任一项所述的方法。 本发明的技术方案,具有如下有益效果: 本发明通过采集样本用户的移动终端APP安装列表信息,根据移动终端APP安装列 表信息提取APP特征和APP组合特征,并对这些特征进行独热编码得到独热编码特征,建立 机器学习模型,利用样本用户的独热编码特征和授信风险结果训练机器学习模型,最后将 待授信用户的移动终端APP安装列表信息转化成的独热编码特征并代入训练完成的机器学 习模型进行训练从而得到待授信用户的授信风险,操作简单,易于实现,且评估的授信风险 结果准确率高,同时还能够在较稀疏的数据集的情况下评估出有多个特征组合时对授信风 险的贡献度,稳定性较好,在建模和特征维护方面,投入的人力少,节省资源,效果显著。 附图说明 为了使本发明所解决的技术问题、采用的技术手段及取得的技术效果更加清楚, 下面将参照附图详细描述本发明的具体实施例。但需声明的是,下面描述的附图仅仅是本 发明示例性实施例的附图,对于本领域的技术人员来讲,在不付出创造性劳动的前提下,可 以根据这些附图获得其他实施例的附图。 图1是本发明的一种基于因子分解机的APP风险评估方法应用场景示意图; 图2是本发明的一种基于因子分解机的APP风险评估方法流程示意图; 图3是本发明的一种基于因子分解机的APP风险评估装置模块架构示意图; 图4是本发明的一种基于因子分解机的APP风险评估的电子设备结构框架示意图; 图5是本发明的计算机可读存储介质示意图。
下载此资料需消耗2积分,
分享到:
收藏