logo好方法网

一种基于图神经网络的社群价值预测方法及系统


技术摘要:
本发明实施例提供一种基于图神经网络的社群价值预测方法及系统,该方法包括:获取用户特征信息和用户交互信息;基于用户特征信息和用户交互信息将所有用户划分为不同的社群;将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对应的  全部
背景技术:
社群价值预测(Community  Value  Prediction)是指对某个关系紧密的用户群体 在未来一段时间段内的累积消费总和进行估计,其典型的应用场景可以为:在社交电商平 台中,商家基于对每个用户群体的社群预测结果,对不同群体有针对性的通过外部干预手 段来兑现或提升用户群的潜在价值,从而提升商家利润。譬如,可以对潜在价值较低的用户 群体,有针对性的发放优惠券,从而提升用户价值。 在实际生产应用中,一方面,预测用户价值的出发点均为基于个体的层面,无法考 虑群体中用户复杂的相互影响作用,从而无法适用于社交电商场景;另一方面,目前预测用 户价值的方法主要基于人为的特征筛选,需要消耗大量人力物力,并且预测的精读高度取 决于特征质量好坏,预测结果无法得到保证,从而带来了高昂的风险管理成本。 目前,用户价值预测方法主要包括两类,一类是基于统计学模型的方法,譬如利用 负二项分布(Negative  Binomial  Distribution,简称NBD)建模人们的购买时间,再大致估 计人们每个时间的购买金额,就能够得到未来购买价值。由于理论模型往往不足以刻画现 实中人的复杂行为与各种外部影响因素,从而造成此类模型的准确率较低、泛化性能较差, 且对于不同群体的用户可能需要不同的模型。另一类是基于机器学习的模型,主要包括基 于支持向量机(Support  Vector  Machine,简称SVM),随机森林(Random  Forest,简称RF)以 及梯度提升树(Gradient  Boosting  Decision  Tree,简称GBDT)构建模型进行机器学习。这 一类方法均需要人为选择特征作为输入进行预测,由于方法的准确率很大程度上取决于特 征的好坏,因此准确率同样不高,同时特征工程还需要花费较大的人力物力。不仅如此,上 述两类方法均无法有效建模与利用社群的结构信息。 综上所述,由于在社交电商中,社群结构对社群价值有极大的影响作用,现有的用 户价值预测方法主要存在以下缺陷:首先,预测效果高度依赖于特征工程的质量,不仅耗费 人力物力,同时预测效果还难以得到保证。其次,预测目标均为从个体角度出发,如果将个 体的预测结果相加得到群体的结果,将会带来预测误差的累加,使得预测效果无法得到保 证。最后,对于社群多层次的结构信息(包括人与人之间的关系,社群的组织结构,以及社群 间的相互关联三个层次)缺乏深入的考虑,无法有效建模和利用社群的结构信息。 有鉴于此,如何综合考虑社群结构信息,并设计实现一个端到端的模型是一个亟 待解决的问题。
技术实现要素:
针对现有技术中的问题,本发明实施例提供一种基于图神经网络的社群价值预测 方法及系统, 5 CN 111582538 A 说 明 书 2/14 页 第一方面,本发明实施例提供一种基于图神经网络的社群价值预测方法,包括:获 取用户特征信息和用户交互信息;基于该用户特征信息和用户交互信息将所有用户划分为 不同的社群;将每个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型, 获取每个社群相对应的社群价值预测值;其中,每个社群所包含的原始特征信息包括组成 所述社群的所有用户的用户特征信息和用户交互信息。 作为可选地,上述基于用户特征信息和用户交互信息将所有用户划分为不同的社 群,包括基于规则的划分方法或基于聚类的划分方法,其中: 基于规则的划分方法,具体可以为:根据用户特征信息和用户交互信息,确定所有 用户中的中心用户;分别以每个中心用户为基础,以与中心用户存在直接交互关系的用户 为组成,构建不同的社群; 基于聚类的划分方法,具体可以为:根据用户特征信息和用户交互信息,将每个用 户建模为不同的节点、将用户之间的交互关系建模为边,构建社交网络图;采用图聚类算法 对所述社交网络图进行聚类,构建不同的社群。 作为可选地,上述社群价值预测模型一般包括依次连接的特征提取与表示子模 块、多聚合器MEL-GCN子模块、社群池化子模块和预测子模块,其中: 特征提取与表示子模块,用于将输入的原始特征信息进行编码映射至连续向量空 间,获取用户个人特征矩阵和用户交互特征矩阵; 多聚合器MEL-GCN子模块,用于根据用户个人特征矩阵和用户交互特征矩阵,建模 在每个社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影响,更 新用户个人特征矩阵中的每个节点状态向量; 社群池化子模块,用于聚合每个社群中的每个节点状态向量,并映射为对应社群 的表征向量; 预测子模块,用于根据所述社群的表征向量获取所述社群相对应的社群价值预测 值。 作为可选地,上述特征提取与表示子模块,用于将输入的原始特征信息进行编码 映射至连续向量空间,获取用户个人特征矩阵和用户交互特征矩阵,具体包括:将原始特征 信息划分为离散特征信息和连续特征信息;根据离散特征信息的取值范围进行独热编码, 将离散特征信息中包含的每个取值表示为只有一个维度为1,其余维度为0的n维向量,其中 n为取值范围;对连续特征信息进行归一化至[0,1]区间;对经过独热编码处理的所述离散 特征信息与经过归一化处理后的连续特征信息进行拼接后,经过全连接层映射至连续向量 空间,获取用户个人特征矩阵和所述用户交互特征矩阵。 作为可选地,上述多聚合器MEL-GCN子模块主要包括基于蒙版边学习的GCN模型和 多聚合器框架;其中,基于蒙版边学习的GCN模型包括边学习组件和至少一个基于蒙版边学 习的图卷积组件; 多聚合器MEL-GCN子模块,主要用于根据用户个人特征矩阵和用户交互特征矩阵, 建模在每个社群内用户之间的交互关系以及在所有社群之间的交互关系对社群价值的影 响,更新用户个人特征矩阵中的每个节点状态向量,具体包括: 分别根据用户个人特征矩阵获取节点特征、根据用户交互特征矩阵获取边特征; 利用边学习组件将每一对相邻节点的节点特征以及节点间的边特征进行拼接后,经过一个 6 CN 111582538 A 说 明 书 3/14 页 全连接层,获取到针对每一条边的蒙版向量; 利用可学习矩阵将所述蒙版向量的维度调整至于当前输入节点的节点状态向量 的维度一致; 利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚合相邻节点,实现 对用户个人特征矩阵中的每个节点状态向量的初步更新; 利用多聚合器框架,分别建模在每个社群内用户之间的交互关系对社群价值的社 群内部影响,以及在所有社群之间的交互关系对社群价值的社群间影响; 综合每个节点的社群内部影响和社群间影响,实现对用户个人特征矩阵中的每个 节点状态向量的更新。 作为可选地,上述利用调整后的蒙版向量作为边控制器,利用GCN卷积网络模型聚 合相邻节点,其计算公式具体为: 其中, 为节点i更新后的状态向量,σ(·)是激活函数, 为返回节点i的 邻居节点集合的函数,⊙ 代表按位点乘运算,Θl为模型参数, 为节点i更新前的状态向 量, 为可学习矩阵,∈ij为蒙版向量。 作为可选地,上述社群池化子模块主要用于聚合每个社群中的每个节点状态向 量,并映射为对应社群的表征向量,具体包括: 确定所述社群中的种子节点集合;将种子节点集合中的每个种子节点的状态向量 与社群中的所有其它节点向量的状态向量进行逐一拼接,获取每个种子节点的拼接状态向 量;利用全连接层对所有拼接状态向量进行处理,获取社群的表征向量。 作为可选地,上述预测子模块主要用于根据所述社群的表征向量获取所述社群相 对应的社群价值预测值,具体包括:根据每个社群的表征向量构建社群表征矩阵;利用一个 两层全连接神经网络作为预测器预测每个社群的社群价值预测值,具体计算公式为: 其中,pT,W Pfc,bfc均为模型参数, 为社群价值预测值,H 为社群表征矩阵。 作为可选地,在上述将每个社群所包含的原始特征信息输入至预先训练好的社群 价值预测模型之前,还包括对社群价值预测模型进行预训练,具体包括: 对社群价值预测模型的超参数进行搜索调优,超参数主要包括学习速率、正则化 系数以及特征空间大小等;利用预先建立的原始特征信息样本集和与每个原始特征信息样 本一一对应的社群价值标签,对社群价值预测模型进行预训练,并通过预先建立的测试集 对训练结果进行测试;在预训练的过程中,使用基于随机梯度下降的优化器,对社群价值预 测模型中的模型参数进行更新,直至更新结果为收敛。 作为可选地,在获取每个社群相对应的社群价值预测值之后,还包括:获取每个社 群价值预测值与真实值之间的平均绝对误差;以平均绝对误差为损失函数,并在损失函数 加入模型参数的L2正则项,对社群价值预测模型进行训练。 作为可选地,上述以平均绝对误差为损失函数,并在损失函数加入模型参数的L2 正则项,具体计算公式为: 7 CN 111582538 A 说 明 书 4/14 页 其中,||·||为求二范数的运算,Θ表示模型所有参数的集合,λ为正则系数, 为 包含所有模型参数的集合,C为训练集中的社群数目。y为真实值, 为社群价值预测值。 第二方面,本发明实施例还提供一种基于图神经网络的社群价值预测系统,所述 识别系统主要包括:信息收取单元、社群划分单元和社群价值估算单元;其中,信息收取单 元主要用于获取用户特征信息和用户交互信息。社群划分单元主要用于用户特征信息和用 户交互信息将所有用户划分为不同的社群。其中,每个社群所包含的原始特征信息包括组 成所述社群的所有用户的用户特征信息和用户交互信息。社群价值估算单元主要用于将每 个社群所包含的原始特征信息输入至预先训练好的社群价值预测模型,获取每个社群相对 应的社群价值预测值。 第三方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器 上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面任一所述 的基于图神经网络的社群价值预测方法的步骤。 第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序, 该计算机程序被处理器执行时实现第一方面任一所述的基于图神经网络的社群价值预测 方法的步骤 由上述技术方案可知,本发明实施例提供的基于图神经网络的社群价值预测方法 及系统,通过综合用户固有的特征信息和用户之间交互信息,构建包含多个层次结构特征 的社群,并获取每个社群的原始特征信息生成表示向量后,基于多层次的神经网络模型分 析,获取到社群价值预测值,有效的提高了预测的精度,减少了人力物力的消耗。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 这些附图获得其他的附图。 图1是本发明实施例提供的一种基于图神经网络的社群价值预测方法的流程示意 图; 图2是本发明实施例提供的另一种基于图神经网络的社群价值预测方法的流程示 意图; 图3是本发明实施例提供的一种社群划分方法示意图; 图4是本发明实施例提供的一种社群价值预测模型构架示意图; 图5是本发明实施例提供的一种特征提取与表征模块工作原理示意图; 图6是本发明实施例提供的一种MEL-GCN模块工作原理示意图; 图7是本发明实施例提供的一种多聚合器框架工作原理示意图; 图8是本发明实施例提供的一种PCPool模块工作原理示意图; 图9是本发明实施例提供的一种基于图神经网络的社群价值预测系统的结构示意 图; 8 CN 111582538 A 说 明 书 5/14 页 图10是本发明实施例的一种设备的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏