logo好方法网

一种电信用户离网预测方法、系统、介质及设备


技术摘要:
本发明涉及一种电信用户离网预测方法、系统、介质及设备。方法包括:读取数据样本,将所述样本数据分割为训练集和测试集;选取Cox比例风险回归模型为预测模型,利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率,完成对所述Cox比  全部
背景技术:
目前,离网概率的分析主要是通过分类模型进行分析,主要有两种,一种是基于传 统机器学习算法的分类模型,如逻辑回归(LR)、支持向量机(SVM)、决策树(C4.5)、朴素贝叶 斯等。另一种为基于集成学习算法的分类模型和多算法模型融合等方案,如GBDT、XGBOOST、 LIGHTGBM等集成学习算法,或对几种算法进行融合使用,分为底层模型和上层模型,以达到 对数据的拟合,训练出效果更好的模型。 但无论上述哪种方案,本质上都是将客户是否流失简单的归类为二分类问题,建 模时也仅是使用用户“在网”或“离网”状态作为因变量,既无法利用生存时间长度,也无法 处理资料中的删失问题。分类模型只能预测用户当前时间的离网概率,而无法预测当前时 间之后一段时间内用户的离网概率。
技术实现要素:
本发明所要解决的技术问题是针对现有技术存在的问题,提供一种电信用户离网 预测方法、系统、介质及设备。 为解决上述技术问题,本发明实施例提供一种电信用户离网预测方法,包括: 读取数据样本,将所述样本数据分割为训练集和测试集; 选取Cox比例风险回归模型为预测模型,利用所述训练集中的训练数据估计Cox比 例风险回归模型中的变量系数和训练数据的基准生存率,完成对所述Cox比例风险回归模 型的模型训练; 利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信 用户离网预测。 为解决上述技术问题,本发明实施例还提供一种电信用户离网预测方法、系统、介 质及设备系统,包括: 样本读取模块,用于读取数据样本,将所述样本数据分割为训练集和测试集; 模型训练模块,用于选取Cox比例风险回归模型为预测模型,利用所述训练集中的 训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率,完成对所述 Cox比例风险回归模型的模型训练; 离网预测模块,用于利用训练完成的所述Cox比例风险回归模型对所述测试集中 的测试数据进行电信用户离网预测。 为解决上述技术问题,本发明实施例还提供一种计算机可读存储介质,包括指令, 当所述指令在计算机上运行时,使所述计算机执行上述技术方案所述的电信用户离网预测 方法。 4 CN 111582577 A 说 明 书 2/7 页 为解决上述技术问题,本发明实施例还提供一种计算机设备,包括存储器、处理器 及存储在所述存储器上的并可在所述处理器上运行的计算机程序,所述处理器执行所述程 序时实现上述技术方案所述的电信用户离网预测方法。 本发明的有益效果是:选取Cox比例风险回归模型为预测模型,将用户的生存状态 和在网时间作为双变量,对带有删失的电信客户生存时间进行研究,不仅能估计具有某种 特征的客户在入网后能够存活一定时间的概率,也能追踪客户离网率如何随时间变化,因 为在进行离网概率预测时,可通过改变用户的在网时间,在网时间的不同,对应的离网概率 不一样的,从而实现追踪客户离网率如何随时间变化;同时根据Cox比例风险回归模型中的 变量系数可分析不同特征变量对客户流失风险的影响,找出流失客户的特征,进而对此类 客户进行针对性地维系工作,降低客户流失率。 本发明附加的方面及其的优点将在下面的描述中部分给出,部分将从下面的描述 中变得明显,或通过本发明实践了解到。 附图说明 图1为本发明实施例提供的电信用户离网预测方法流程图; 图2为本发明实施例提供的参数估计结果图; 图3为本发明实施例提供的训练结果图; 图4为本发明实施例提供的电信用户离网预测系统框图。
分享到:
收藏