技术摘要:
本发明公开了数据相关性分析方法、装置、计算机系统及可读存储介质,基于人工智能,包括:获取历史业务数据并提取其中的产品信息,按照产品信息对历史业务数据分类,获得至少一个由同一产品信息的历史业务数据构成的数据集合;计算数据集合的信息熵以确定数据集合的定 全部
背景技术:
导流是指平台方将一笔客户申请转发到一家资金方,即将客户在平台方申请的某 一交易产品转化为资金方的产品信息的过程。随着互联网金融的不断发展,平台方会对接 多家产品信息,各家产品信息对客户要求不尽相同。有些产品信息受限于展业地区,因此对 客户的地区有要求;有些对客户的贷款金额有限制,如何依据业务数据正确确定一家产品 信息是平台方必须解决的问题。 为解决上述问题,当前的平台方采用了树状图式的管理方式,也就是将对展业地 区有要求的产品信息分为一类,对展业地区无要求的分为另一类;在此基础上再将对贷款 金额有限制的分为一类,对贷款金额无限制的分为另一类,以此类推;然而这种根据资金方 的要求对客户申请进行粗略划分的方法,只能从较为单一的维度上划分客户申请以满足资 金方的硬性要求,无法识别资金方在硬性要求之外的因素(如,资金方因其历史数据分析所 指定的贷款偏好因素、风险控制的维度等),因此无法对客户申请进行精准匹配,导致平台 方所推荐的产品信息成功率较低。
技术实现要素:
本发明的目的是提供一种数据相关性分析方法、装置、计算机系统及可读存储介 质,用于解决现有技术存在的无法识别资金方在硬性要求之外的因素,导致无法对客户申 请进行精准匹配,使平台方所推荐的产品信息成功率较低的问题。 为实现上述目的,本发明提供一种基于人工智能的数据相关性分析方法,包括: 获取历史业务数据并提取其中的产品信息,按照产品信息对所述历史业务数据分 类,获得至少一个由同一产品信息的历史业务数据构成的数据集合并将其发送至综合数据 库;其中,所述产品信息是历史业务数据中反应用户消费的产品的名称信息; 从所述综合数据库中提取数据集合,并计算所述数据集合的信息熵以确定所述数 据集合的定性分析维度,根据各定性分析维度下的定性信息制定所述数据集合的定性判断 条件并将其发送至定性知识库;其中,所述定性判断条件是反应数据集合中具有识别度的 定性信息; 从所述综合数据库中提取数据集合,并计算所述数据集合的最大密度范围以确定 所述数据集合的定量分析维度,根据各定量分析维度及其最大密度范围制定所述数据集合 的定量判断条件并将其发送至定量知识库;其中,所述定量判断条件是反应数据集合中具 有识别度的定量信息; 接收由人机界面输出的记载有用户的定量信息和定性信息的待评估数据,并分别 从所述定性知识库和定量知识库中提取定性判断条件和定量判断条件,根据所述定性判断 5 CN 111581296 A 说 明 书 2/13 页 条件及定量判断条件计算所述待评估数据与各数据集合之间的相关度并获得相关评估值, 将相关评估值最高的数据集合的产品信息发送所述人机界面。 上述方案中,所述获取历史业务数据并提取其中的产品信息的步骤,包括: 设定训练数量,从历史数据库中获取数量与所述训练数量一致的历史业务数据; 获取所述历史业务数据中的维度值类型,将维度值类型为字符所对应的维度ID和 维度编码设为定性维度,将定性维度所对应的信息设为定性信息,将维度值类型为码值、或 日期、或数值所对应的维度ID和维度编码设为定量维度,将所述定量维度所对应的信息设 为定量信息;其中,所述维度ID是标注历史业务数据中维度特征的数字编号; 提取所述历史业务数据的产品信息。 上述方案中,所述计算所述数据集合的信息熵以确定所述数据集合的定性分析维 度的步骤,包括: 汇总数据集合的历史业务数据中各定性维度下的定性信息以获得定性集合; 通过预设的信息增益模型计算所述定性集合中各种类定性信息出现的概率,以获 得与所述定性集合对应的定性维度的信息熵; 将信息熵小于预设的信息阈值的定性维度,设为所述数据集合的定性分析维度。 上述方案中,所述根据各定性分析维度下的定性信息制定所述数据集合的定性判 断条件的步骤,包括: 将数据集合中在所述定性分析维度下出现概率最高的定性种类设为判断值域; 从预设的定性映射表中获取与所述定性分析维度对应的判断方式,及汇总所述判 断值域和判断方式生成所述数据集合的定性判断条件。 上述方案中,所述计算所述数据集合的最大密度范围以确定所述数据集合的定量 分析维度的步骤,包括: 通过预设的均值漂移模型计算所述数据集合中各定量维度下定量信息的最大密 度范围; 提取所述最大密度范围中定量信息的数量,若该数量大于预设的定量阈值,则将 所述最大密度范围所对应的定量维度设为所述数据集合的定量分析维度。 上述方案中,所述根据各定量分析维度及其最大密度范围制定所述数据集合的定 量判断条件的步骤,包括: 从预设的定量映射表中获得定量分析维度的判断方式,并将所述最大密度范围作 为判断值域; 汇总所述判断值域和判断方式生成所述定量分析维度的定量判断条件。 上述方案中,根据所述定性判断条件及定量判断条件计算所述待评估数据与各数 据集合之间的相关度并获得相关评估值的步骤,包括: 根据各数据集合的定性判断条件,计算待评估数据的定性信息与所述各数据集合 之间的相关度,以获得定性评估值; 根据各数据集合的定量判断条件,计算待评估数据的定量信息与所述各数据集合 之间的相关度,以获得定量评估值; 对所述定量评估值和定性评估值进行加权计算,获得反映所述待评估数据与各数 据集合之间匹配度的相关评估值。 6 CN 111581296 A 说 明 书 3/13 页 为实现上述目的,本发明还一种基于人工智能的数据相关性分析装置,包括: 数据处理模块,用于获取历史业务数据并提取其中的产品信息,按照产品信息对 所述历史业务数据分类,获得至少一个由同一产品信息的历史业务数据构成的数据集合并 将其发送至综合数据库;其中,所述产品信息是历史业务数据中反应用户消费的产品的名 称信息; 定性分析模块,用于从所述综合数据库中提取数据集合,并计算所述数据集合的 信息熵以确定所述数据集合的定性分析维度,根据各定性分析维度下的定性信息制定所述 数据集合的定性判断条件并将其发送至定性知识库;其中,所述定性判断条件是反应数据 集合中具有识别度的定性信息; 定向分析模块,用于从所述综合数据库中提取数据集合,并计算所述数据集合的 最大密度范围以确定所述数据集合的定量分析维度,根据各定量分析维度及其最大密度范 围制定所述数据集合的定量判断条件并将其发送至定量知识库;其中,所述定量判断条件 是反应数据集合中具有识别度的定量信息; 推理机模块,用于接收由人机界面输出的记载有用户的定量信息和定性信息的待 评估数据,并分别从所述定性知识库和定量知识库中提取定性判断条件和定量判断条件, 根据所述定性判断条件及定量判断条件计算所述待评估数据与各数据集合之间的相关度 并获得相关评估值,将相关评估值最高的数据集合的产品信息发送所述人机界面; 人机界面,用于输出待评估数据及接收产品信息。 为实现上述目的,本发明还提供一种计算机系统,其包括多个计算机设备,各计算 机设备包括存储器.处理器以及存储在存储器上并可在处理器上运行的计算机程序,所述 多个计算机设备的处理器执行所述计算机程序时共同实现上述数据相关性分析方法的步 骤。 为实现上述目的,本发明还提供一种计算机可读存储介质,其包括多个存储介质, 各存储介质上存储有计算机程序,所述多个存储介质存储的所述计算机程序被处理器执行 时共同实现上述数据相关性分析方法的步骤。 本发明提供的数据相关性分析方法、装置、计算机系统及可读存储介质,通过综合 数据库实现对历史业务数据进行分类并获得数据集合,每个数据集合都蕴含了每个产品信 息的硬性要求,及硬性要求以外的所有因素;通过定性知识库计算数据集合获得具有识别 度的定性维度并将其设为定性分析维度,根据该定性分析维度获得在定性分析维度下最具 识别度的判断值域和判断方式,以实现识别产品信息的定性维度上的所有要求;通过定量 知识库计算数据集合获得具有识别度的定量维度并将其设为定量分析维度,根据该定量分 析维度获得在定量分析维度下最具识别度的判断值域和判断方式,以实现识别产品信息的 定量维度上的所有要求;通过推理机对人机界面输出的待评估数据,分别从定量判断条件 和定性判断条件两方面进行计算以获得,待评估数据与各数据集合之间的相关评估值,以 实现从定量维度和定性维度上判断待评估数据与各产品信息的匹配度,实现了待评估数据 与产品信息之间的精准匹配,提高了平台方所推荐的产品信息成功率,因此解决了现有技 术中存在的无法识别资金方在硬性要求之外的因素,导致无法对客户申请进行精准匹配, 使平台方所推荐的产品信息成功率较低的问题。 7 CN 111581296 A 说 明 书 4/13 页 附图说明 图1为本发明数据相关性分析方法实施例一的流程图; 图2为本发明数据相关性分析方法实施例一S1中获取历史业务数据并提取其中的 产品信息的流程图; 图3为本发明数据相关性分析方法实施例一S2中所确定所述数据集合的定性分析 维度的流程图; 图4为本发明数据相关性分析方法实施例一S2中制定所述数据集合的定性判断条 件的流程图; 图5为本发明数据相关性分析方法实施例一S3中确定所述数据集合的定量分析维 度的流程图; 图6为本发明数据相关性分析方法实施例一S3中制定所述数据集合的定量判断条 件的流程图; 图7为本发明数据相关性分析方法实施例一S4中获得描述所述待评估数据与各数 据集合之间匹配度的相关评估值的流程图; 图8为本发明数据相关性分析装置实施例二的程序模块示意图; 图9为本发明计算机系统实施例三中计算机设备的硬件结构示意图。 附图标记: 1、数据相关性分析装置2、计算机设备11、数据处理模块 12、定性分析模块13、定向分析模块14、推理机模块 15、人机界面21、存储器22、处理器