logo好方法网

一种基于图卷积网络的符号网络符号的预测方法


技术摘要:
本发明公开了一种基于图卷积网络的符号网络符号的预测方法,基于图神经网络中的GCN模型,结合符号网络的只分成正边和负边两种情况,将符号网络分成只包含正边和只包含负边的两个子网络,对这两个子网络进行预处理,得到它们的邻接矩阵和特征矩阵。使用设计的图卷积网络  全部
背景技术:
真实世界中的各种关系都可以在一定程度上抽象为复杂网络,包括人与人的关 系、人与物的关系以及物与物之间的关系,通过将这些相互之间的关系进行整合可以形成 包含多个个体、多种关系的异质信息网络。真实世界中的个体称为网络中的节点,真实世界 中个体之间的关系抽象为网络中的边。其中人与人的关系中包含了亲善,喜爱等正向关系, 同时也包含了厌恶等负向关系,将这些关系抽象成网络中的边,网络中便会包含两种结构 关系,包含这种正向关系和负向关系的网络被称为符号网络,符号网络是一种特殊的异质 信息网络。因此,在推荐系统中,识别人与人之间的关系类型,是一项重要的任务。 随着卷积神经网络在图像处理上的广泛运用,将卷积神经网络运用到图处理方向 上成为了一种新的研究思路,通过图傅里叶变换,能够将信号从时域空间转换到频域空间, 而频域空间视角能够有助于信号的处理,因此图中的卷积操作有了理论依据,通过设计图 滤波器,便可以生成图卷积层,进而生成图卷积网络模型。 评估符号网络之间的边得符号预测有多种方式,本质上是基于符号网络的正负边 关系来进行预测学习分析,符号网络的主要性质有结构平衡理论,相似理论和节点状态理 论,每一个理论都是基于节点的正负边的关系来进行分析学习的,通过理论,得到节点的正 边和负边的倾向关系,例如结构平衡理论,通过分析三元组节点之间的平衡关系,来识别边 的符号倾向性。
技术实现要素:
针对上述现有技术,本发明提出一种基于图卷积网络(GCN,Graph  Convolutional  Network)的符号网络符号预测方法,主要是基于GCN符号网络中节点与节点之间的边的正 负关系对网络中节点的符号倾向性进行预测,根据图卷积网络的灵活运用,来输出节点的 正倾向性和负倾向性的向量表示,通过预测节点的正倾向性的概率和负倾向性的概率,拼 接后向量表示后取概率最大的结果,从而来预测节点与节点之间的倾向性。本发明方法不 论是理论创新方面还是实验效果方面都有很大的突破。 为了解决上述技术问题,本发明提出的一种基于图卷积网络的符号网络符号的预 测方法,步骤如下: 步骤一、基于图神经网络中的图卷积网络模型,结合符号网络中自身的边只分成 正边和负边的两种情形,将符号网络分成两个子网络,其中一个子网络是只包含正边的正 边子网络,另一个子网络是只包含负边的负边子网路,对正边子网络和负边子网络分别进 行预处理,得到两个子网络的邻接矩阵和特征矩阵; 步骤二、使用构建的两层图卷积网络模型训练两个子网络的邻接矩阵和特征矩 阵,得到正边子网络表示和负边子网络表示,将正边子网络表示和负边子网络表示进行拼 4 CN 111581297 A 说 明 书 2/5 页 接得到符号网络的节点表示; 步骤三、进行符号网络的符号预测,选用wiki-vote测试数据集,将该测试数据集 在所述两层图卷积网络模型中进行测试,得到基于所述两层图卷积网络模型生成的节点表 示,利用所生成的节点表示评估该测试数据集的边的符号倾向性,其中,在得到节点表示 后,使用逻辑回归模型得到边的概率,该边的概率包括边的正向概率和边的负向概率,通过 比较边的正向概率和边的负向概率的大小,从而判断该边的符号倾向性。 进一步讲,步骤一中,对正边子网络和负边子网络分别进行预处理,得到两个子网 络的邻接矩阵和特征矩阵的具体过程如下: 获得符号网络用例数据,所述用例数据是wiki-vote数据集,该数据集的数据结构 是:名称为Wiki-vote,节点数为7118,边的数量为103747,正向边占比为78.8%,负向边占 比为21.2%;读取数据集wiki-vote数据,将节点的正边和负边分离开,即将节点的边进行 迭代判定,其中,所有的正边形成一个集合,所有的负边形成一个集合,基于两个边的集合, 结合原数据中的节点,构建只包含正边的正边子网络的邻接矩阵和只包含负边的负边子网 络的邻接矩阵;由于,数据集wiki-vote中默认的数据权重为1,因此,正边子网络的邻接矩 阵和负边子网络的邻接矩阵是基于节点的度分布,根据节点的出度入度相关属性,构建并 得到正边子网络的特征矩阵和负边子网络的特征矩阵。 步骤二中,构建两层图卷积网络模型,包括以下步骤: 使用下述图卷积网络的迭代公式: 式(1)中,σ代表非线性变换;h表示特征表示结果;l表示设计的图神经网络层数;w 表示权重,w=1;c表示归一化因子; 将特征矩阵和邻接矩阵代入上述迭代公式中,并替代其中的特征表示结果,得到: Hl 1=σ(AHlWl)     (2) 式(2)中,H表示特征矩阵,A表示邻接矩阵,W代表权重矩阵,由于输入的特征矩阵H 与邻接矩阵A是带有符号倾向性,用A 和H 分别表示正边子网络的邻接矩阵和正边子网络的 特征矩阵,同时,用A-和H-分别表示负边子网络的邻接矩阵和负边子网络的特征矩阵;因此, 计算的结果 与 分别表示正边子网络的特征矩阵和负边子网络的特征矩阵,将其拼 接,得到最终结果是: 根据构建的两层图卷积网络模型得到原符号网络的网络表示。 本发明所述的基于图卷积网络的符号网络符号的预测方法,其中,从数据库获取 用户相关数据,包含表的筛选和表中字段的筛选;数据预处理和清洗;从数据中抽象出实体 和关系,以此构建符号网络。 与现有技术相比,本发明的有益效果是: 传统的符号网络符号预测方法以及图卷积网络应用方法都比较多,但是综合两者 的方法,基于图卷积网络的符号网络符号预测计算方法还有很多价值并未被发掘。本发明 方法主要是有以下几个有益效果: 5 CN 111581297 A 说 明 书 3/5 页 首先,本发明方法将理论上的符号网络符号预测方法与实际应用领域的图卷积网 络结合起来,理论实践相互结合,能在实践中体现理论研究的价值。 其次,本发明方法不同于大部分机器学习方法,无需对数据提前打标签,能更好地 与实际生产中的数据环境相融合。 最后,本发明方法有很好的扩展性,可以在图卷积网络中添加全连接层与其他模 型(诸如:transe模型,图注意力机制等),提升符号网络符号预测效果。 附图说明 图1是本发明方法的流程框图; 图2是设计的图卷积网络模型示例; 图3是结果分析示例。
下载此资料需消耗2积分,
分享到:
收藏