一种电信用户离网预测方法、系统、介质及设备-好方法网

技术摘要：
本发明涉及一种电信用户离网预测方法、系统、介质及设备。方法包括：读取数据样本，将所述样本数据分割为训练集和测试集；选取Cox比例风险回归模型为预测模型，利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率，完成对所述Cox比全部
背景技术：
目前，离网概率的分析主要是通过分类模型进行分析，主要有两种，一种是基于传统机器学习算法的分类模型，如逻辑回归(LR)、支持向量机(SVM)、决策树(C4.5)、朴素贝叶斯等。另一种为基于集成学习算法的分类模型和多算法模型融合等方案，如GBDT、XGBOOST、 LIGHTGBM等集成学习算法，或对几种算法进行融合使用，分为底层模型和上层模型，以达到对数据的拟合，训练出效果更好的模型。但无论上述哪种方案，本质上都是将客户是否流失简单的归类为二分类问题，建模时也仅是使用用户“在网”或“离网”状态作为因变量，既无法利用生存时间长度，也无法处理资料中的删失问题。分类模型只能预测用户当前时间的离网概率，而无法预测当前时间之后一段时间内用户的离网概率。
技术实现要素：
本发明所要解决的技术问题是针对现有技术存在的问题，提供一种电信用户离网预测方法、系统、介质及设备。为解决上述技术问题，本发明实施例提供一种电信用户离网预测方法，包括：读取数据样本，将所述样本数据分割为训练集和测试集；选取Cox比例风险回归模型为预测模型，利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率，完成对所述Cox比例风险回归模型的模型训练；利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测。为解决上述技术问题，本发明实施例还提供一种电信用户离网预测方法、系统、介质及设备系统，包括：样本读取模块，用于读取数据样本，将所述样本数据分割为训练集和测试集；模型训练模块，用于选取Cox比例风险回归模型为预测模型，利用所述训练集中的训练数据估计Cox比例风险回归模型中的变量系数和训练数据的基准生存率，完成对所述 Cox比例风险回归模型的模型训练；离网预测模块，用于利用训练完成的所述Cox比例风险回归模型对所述测试集中的测试数据进行电信用户离网预测。为解决上述技术问题，本发明实施例还提供一种计算机可读存储介质，包括指令，当所述指令在计算机上运行时，使所述计算机执行上述技术方案所述的电信用户离网预测方法。 4 CN 111582577 A 说　明　书 2/7 页为解决上述技术问题，本发明实施例还提供一种计算机设备，包括存储器、处理器及存储在所述存储器上的并可在所述处理器上运行的计算机程序，所述处理器执行所述程序时实现上述技术方案所述的电信用户离网预测方法。本发明的有益效果是：选取Cox比例风险回归模型为预测模型，将用户的生存状态和在网时间作为双变量，对带有删失的电信客户生存时间进行研究，不仅能估计具有某种特征的客户在入网后能够存活一定时间的概率，也能追踪客户离网率如何随时间变化，因为在进行离网概率预测时，可通过改变用户的在网时间，在网时间的不同，对应的离网概率不一样的，从而实现追踪客户离网率如何随时间变化；同时根据Cox比例风险回归模型中的变量系数可分析不同特征变量对客户流失风险的影响，找出流失客户的特征，进而对此类客户进行针对性地维系工作，降低客户流失率。本发明附加的方面及其的优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明实践了解到。附图说明图1为本发明实施例提供的电信用户离网预测方法流程图；图2为本发明实施例提供的参数估计结果图；图3为本发明实施例提供的训练结果图；图4为本发明实施例提供的电信用户离网预测系统框图。

相关推荐