logo好方法网

一种基于用户身份辨别的社交分析方法


技术摘要:
本发明提供了一种基于用户身份辨别的社交分析方法,包括:基于社交平台爬取目标用户的第一身份信息;对爬取的目标用户的所有第一身份信息进行第一聚类处理,根据第一聚类处理结果,确定目标用户的每类身份信息的类身份属性;爬取目标用户的每个第一身份信息的第一社交  全部
背景技术:
随着社交软件的广泛应用,在社交平台上交友、聊天等成为常见社交方式,且基于 平台对用户进行社交分析,一般只是简单的根据用户的搜索词、用户选择的标签等内容进 行信息或者是好友的推送,且在对用户进行分析时,基本上不考虑用户的身份,而是完全依 赖于用户在该平台上的自主选择,而且平台与平台之间的身份信息、社交信息等是相互独 立的,而且,在现有的情感交友等相关软件上,存在一些身份欺骗信息,因此,对用户身份进 行辨别是非常重要的,进而设计了一种基于用户身份辨别的社交分析方法。
技术实现要素:
本发明提供一种基于用户身份辨别的社交分析方法,用以通过从若干个社交平台 上爬取第一身份信息和第一社交信息,构建类社交矩阵,进而确定用户的社交特性,提高社 交可靠性,降低社交风险。 本发明实施例提供一种基于用户身份辨别的社交分析方法,包括: 基于社交平台爬取目标用户的第一身份信息; 对爬取的所述目标用户的所有第一身份信息进行第一聚类处理,根据第一聚类处 理结果,确定所述目标用户的每类身份信息的类身份属性; 爬取所述目标用户的每个所述第一身份信息的第一社交信息,并获取每个所述第 一社交信息的第一社交特征向量,并根据每类身份信息的类身份属性,构造对应的类社交 矩阵; 基于构造的所有类社交矩阵,确定所述目标用户的所有社交标识,进而根据所述 所有社交标识,确定所述目标用户的社交特性,完成社交分析。 在一种可能实现的方式中,获取每个所述第一社交信息的第一社交特征向量,并 根据每类身份信息的类身份属性,构造对应的类社交矩阵的过程中,还包括: 选取所有类社交矩阵对应的社交特征值大于或等于预设特征值的第一社交矩阵 对应的第一身份信息; 确定所述第一社交矩阵中的每个第一社交特征向量与对应的选取的第一身份属 性的相似度; 保留所述第一社交矩阵中相似度大于预设度的第一社交特征向量,并基于保留的 第一社交特征向量,重新构造新的第一社交矩阵。 在一种可能实现的方式中,在选取所述第一社交矩阵对应的第一身份信息时,还 包括: 筛选所有类社交矩阵对应的社交特征值小于预设特征值的第二社交矩阵E; 5 CN 111581522 A 说 明 书 2/11 页 将所有所述第一社交矩阵中相似度小于或等于预设度的第一社交特征向量,构造 成一个补偿社交矩阵E1; 基于所述补偿社交矩阵E1对所有所述第二社交矩阵E进行补偿处理,获得第三社 交矩阵E′; 其中,e表示自然常数;λE表示所述补偿矩阵E1的特征值;δE表示所述补偿矩阵E1的 误差增益因子。 在一种可能实现的方式中,当完成社交分析之后,还包括: 构建所述目标用户的社交数据链,所述社交数据链中包括:所述目标用户的每类 身份信息、每类身份信息对应的类身份属性、社交标识和社交特性; 基于社交服务器,对构建的所述社交数据链及其社交数据进行评级处理,获得预 设数目个由高到低的等级数据,并将与所述等级数据一一对应的等级标识传输到所述目标 用户的目标端进行标识列显示; 当存在交互用户进行用户搜索时,根据所述交互用户的搜索关键词,向所述交互 用户的交互端推送与所述搜索关键词相匹配的匹配用户; 如果所述交互用户与所述匹配用户不是好友关系或者所述交互用户未注册,基于 所述社交服务器,自动向所述交互用户的交互端推送与所述匹配用户相关的默认数据; 其中,所述默认数据是基于所述社交服务器,且根据预设规则,自动默认的与低等 级标识相关的可查看数据; 如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,此时,所 述标识列供对应的所述匹配用户选择可被所述交互用户查看的待选择标识,所述交互用户 通过选择所述待选择标识,查看与所述匹配用户相关的可查看数据; 如果所述交互用户与所述匹配用户是好友关系且所述交互用户已注册,所述目标 用户未基于所述标识列执行任何操作,则基于所述社交服务器向所述交互用户的交互端推 送所述默认数据; 其中,基于所述社交服务器还向所述交互用户的交互端推送其他用户对所述默认 数据对应的匹配用户的用户评价。 在一种可能实现的方式中,当存在交互用户进行用户搜索时,根据所述交互用户 的搜索关键词,向所述交互用户的交互端推送与所述搜索关键词相匹配的匹配用户的过程 中包括: 根据所述搜索关键词,基于所述社交服务器进行第一用户集群的初次筛选,且所 述初次筛选的过程中包括: 基于预先设定的聚类点,确定所述第一用户集群中的每个用户与所述聚类点的聚 类距离,将所述聚类距离小于预设距离的用户删除,得到第二用户集群; 深度挖掘所述第二用户集群中每个用户的综合社交信息和与所述交互用户处于 同一社交平台的独立社交信息; 6 CN 111581522 A 说 明 书 3/11 页 基于所述同一社交平台的社交属性,且根据每个用户的综合社交信息和独立社交 信息,基于所述社交服务器进行所述第二用户集群中的再次筛选,获得第三用户集群; 同时,对所述第三用户集群中的每个用户进行与所述搜索关键词的由高到低的相 关性的排序,并输出到所述交互用户的交互端进行显示。 在一种可能实现的方式中,所述基于社交平台爬取目标用户的第一身份信息的步 骤包括: 统计所述目标用户的目标端的社交平台; 判断所述目标用户基于每个所述社交平台的用户权限; 当所述用户权限为游客登录时,获取第一信息; 或,当所述用户权限为非游客且会员登录时,获取第二信息; 或,当所述用户权限仅为非游客登录时,获取第三信息; 根据获取的所述第一信息、第二信息或第三信息,得到所述目标用户基于所述社 交网路的第一身份信息。 在一种可能实现的方式中,根据第一聚类处理结果,确定所述目标用户的每类身 份信息的类身份属性的过程中,还包括: 基于与所述第一聚类处理的修理标准,对所述目标用户下载和/或浏览的每个社 交平台的社交属性进行第二聚类处理,并根据第二聚类处理结果,确定每类社交平台的类 社交属性; 确定所述类社交属性与类身份属性是否对应的分类一致; 若一致,继续执行后续操作; 若不一致,则统计分类不一致的所有不一致的第一身份信息和社交平台,并根据 统计结果,所述不一致的n个第一身份信息和m个社交平台进行归一化处理; 其中,f1表示第一身份信息的归一化函数;f2表示社交平台的归一化函数;i表示n 个第一身份信息中的第i个身份信息;j表示m个社交平台中的第i个社交平台; 表示第一 身份信息的平均函数值; 表示社交平台的平均函数值;G表示归一化处理结果; 并将所述归一化处理结果G,作为确定所述类身份属性的身份属性修正参数。 在一种可能实现的方式中,基于构造的所有类社交矩阵,确定所述目标用户的所 有社交标识的过程中,包括: 按照预设分裂规则,将所述类社交矩阵分裂为身份矩阵S1和社交矩阵S2,同时确 定身份矩阵S1与社交矩阵S2的高斯分布; 确定所述身份矩阵S1与社交矩阵S2之间的信任概率p; 根据身份高斯分布q1、社交高斯分布q2以及信任概率p,同时基于贝叶斯公式,确 定所述类社交矩阵的后验概率分布Γ; 基于所述后验概率分布Γ,确定所述类社交矩阵的最小损失函数L; 7 CN 111581522 A 说 明 书 4/11 页 其中,X表示预先设定的所述类社交矩阵中的身份矩阵与社交矩阵的标准信任矩 阵; 基于标识数据库,匹配与所述最小损失函数相关的社交标识,进而实现对所有类 社交矩阵对应的社交标识的确定。 在一种可能实现的方式中,爬取所述目标用户的每个所述第一身份信息的第一社 交信息,并获取每个所述第一社交信息的第一社交特征向量之后,还包括: 对每个所述第一社交信息中的图片社交、语音社交、动画社交、视频社交、文字社 交进行社交分类; 确定每个社交分类对应的第一社交场景以及不同社交分类之间对应的第二社交 场景,并根据所述第一社交场景和第二社交场景,获得所述第一社交信息的场景属性; 确定每个社交分类对应的第一分类关键点以及不同社交分类之间对应的第二分 类关键点,并根据所述第一分类关键点和第二分类关键点,获得所述第一社交信息的关键 属性; 根据所述场景属性和关键属性,分析识别所述目标用户的喜好信息; 根据所述喜好信息向所述目标用户的目标端推送相关的交互用户,同时,基于所 述社交服务器向所述目标端推送提示信息; 基于所述社交服务器,还向所述交互用户推送同个社交平台同属性目标用户。 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 附图说明 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实 施例一起用于解释本发明,并不构成对本发明的限制。在附图中: 图1为本发明实施例中一种基于用户身份辨别的社交分析方法的流程图。
分享到:
收藏