logo好方法网

一种安全数据分析方法、装置、系统、设备及存储介质


技术摘要:
本申请实施例公开了一种安全数据分析方法、装置、系统、设备及存储介质,该方法包括:获取被监测系统产生的原始安全数据;对原始安全数据进行预处理得到待分析安全数据;将待分析安全数据划分为统计数据和分布式数据;对由统计数据所属的属性组成的第一属性集合,根据  全部
背景技术:
安全数据分析,是指利用特定的手段对网络安全运维相关的数据进行挖掘和分 析。安全策略开发人员可以基于安全数据分析结果,制定相应的安全策略,以抵御网络攻击 行为和威胁行为,弥补安全防护措施的不足。 现阶段,主要由相关技术人员人工对安全数据进行分析,受到主观知识经验的限 制,相关技术人员分析安全数据时,通常只关注几种具有典型属性的安全数据。在安全数据 日益多样化的今天,上述安全数据分析方式难以客观全面地衡量安全数据涉及的各种属 性,容易忽略一些对于制定安全策略有帮助的属性,因而难以保证安全数据分析结果的准 确性,对后续安全策略的制定也会产生一定的影响;此外,人工分析安全数据速度慢、效率 低,难以满足如今大数据时代的需求。
技术实现要素:
本申请实施例提供了一种安全数据分析方法、装置、系统、设备及存储介质,能够 保证最终获得的安全数据分析结果的准确性,有利于据此制定有效的安全策略。 有鉴于此,本申请第一方面提供了一种安全数据分析方法,所述方法包括: 获取原始安全数据;所述原始安全数据包括被监测系统产生的数据; 对所述原始安全数据进行预处理,得到待分析安全数据; 将所述待分析安全数据划分为统计数据和分布式数据;所述统计数据具有聚集特 征,所述分布式数据具有非聚集特征; 针对由所述统计数据所属的属性组成的第一属性集合,根据所述第一属性集合中 各种属性下的统计数据量,确定所述第一属性集合中各种属性各自的重要度和/或覆盖度; 根据所述第一属性集合中各种属性各自的重要度和/或覆盖度,从所述第一属性集合中选 出第一目标属性; 针对由所述分布式数据所属的属性组成的第二属性集合,通过机器学习模型根据 所述第二属性集合中各种属性下的分布式数据,确定所述第二属性集合中各种属性各自的 重要度;根据所述第二属性集合中各种属性各自的重要度,从所述第二属性集合中选出第 二目标属性; 根据所述第一目标属性对应的统计数据和所述第二目标属性对应的分布式数据, 确定安全数据分析结果。 本申请第二方面提供了一种安全数据分析装置,所述装置包括: 数据获取模块,用于获取原始安全数据;所述原始安全数据包括被监测系统产生 的数据; 5 CN 111581258 A 说 明 书 2/20 页 预处理模块,用于对所述原始安全数据进行预处理,得到待分析安全数据; 数据划分模块,用于将所述待分析安全数据划分为统计数据和分布式数据;所述 统计数据具有聚集特征,所述分布式数据具有非聚集特征; 统计数据分析模块,用于针对由所述统计数据所属的属性组成的第一属性集合, 根据所述第一属性集合中各种属性下的统计数据量,确定所述第一属性集合中各种属性各 自的重要度和/或覆盖度;根据所述第一属性集合中各种属性各自的重要度和/或覆盖度, 从所述第一属性集合中选出第一目标属性; 分布式数据分析模块,用于针对由所述分布式数据所属的属性组成的第二属性集 合,通过机器学习模型根据所述第二属性集合中各种属性下的分布式数据,确定所述第二 属性集合中各种属性各自的重要度;根据所述第二属性集合中各种属性各自的重要度,从 所述第二属性集合中选出第二目标属性; 结果确定模块,用于根据所述第一目标属性对应的统计数据和所述第二目标属性 对应的分布式数据,确定安全数据分析结果。 本申请第三方面提供了一种安全数据分析系统,所述系统包括:预处理引擎、分发 引擎、选举引擎、定量分析引擎和分析引擎;所述选举引擎和所述定量分析引擎部署于分布 式云计算平台; 所述预处理引擎,用于对原始安全数据进行预处理,得到待分析安全数据;所述原 始安全数据包括被监测系统产生的数据; 所述分发引擎,用于将所述待分析安全数据划分为统计数据和分布式数据,将所 述统计数据发送给所述定量分析引擎,将所述分布式数据发送给所述选举引擎;所述统计 数据具有聚集特征,所述分布式数据具有非聚集特征; 所述定量分析引擎,用于针对由所述统计数据所属的属性组成的第一属性集合, 根据所述第一属性集合中各种属性下的统计数据量,确定所述第一属性集合中各种属性各 自的重要度和/或覆盖度;根据所述第一属性集合中各种属性各自的重要度和/或覆盖度, 从所述第一属性集合中选出第一目标属性; 所述选举引擎,用于针对由所述分布式数据所属的属性组成的第二属性集合,通 过机器学习模型根据所述第二属性集合中各种属性下的分布式数据,确定所述第二属性集 合中各种属性各自的重要度;根据所述第二属性集合中各种属性各自的重要度,从所述第 二属性集合中选出第二目标属性; 所述分析引擎,用于根据所述第一目标属性对应的统计数据和所述第二目标属性 对应的分布式数据,确定安全数据分析结果。 本申请第四方面提供了一种设备,所述设备包括处理器以及存储器: 所述存储器用于存储计算机程序; 所述处理器用于根据所述计算机程序,执行如上述第一方面所述的安全数据分析 方法的步骤。 本申请第五方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于 存储计算机程序,所述计算机程序用于执行上述第一方面所述的安全数据分析方法的步 骤。 本申请第六方面提供了一种包括指令的计算机程序产品,当其在计算机上运行 6 CN 111581258 A 说 明 书 3/20 页 时,使得所述计算机执行上述第一方面所述的安全数据分析方法的步骤。 从以上技术方案可以看出,本申请实施例具有以下优点: 本申请实施例提供了一种安全数据分析方法,该方法从定量分析和定性分析两个 维度并行出发,客观全面地衡量安全数据涉及的各种属性的重要程度,进而基于重要属性 对应的安全数据,确定对于制定安全策略具有参考意义的安全数据分析结果。具体的,在本 申请实施例提供的方法中,对所获取的原始安全数据进行预处理得到待分析安全数据后, 将待分析安全数据划分为具有聚集特征的统计数据和具有非聚集特征的分布式数据;针对 统计数据涉及的属性,采用定量分析的方式确定各种属性的重要度和/或覆盖度,进而基于 此从统计数据涉及的属性中选出第一目标属性;针对分布式数据涉及的属性,借助机器学 习模型采用定性分析的方式确定各种属性的重要度,进而基于此从分布式数据涉及的属性 中选出第二目标属性;最终,根据第一目标属性和第二目标属性各自对应的安全数据,确定 安全数据分析结果。相比相关技术中人工分析安全数据的实现方式,本申请实施例提供的 方法可以基于数据特征将安全数据划分为统计数据和分布式数据,采用定量分析的方式衡 量统计数据涉及的各种属性的重要程度,采用定性分析的方式衡量分布式数据涉及的各种 属性的重要程度,如此实现客观全面地衡量安全数据涉及的各种属性,进而基于衡量结果 从安全数据涉及的各种属性中选出对于制定安全策略具有较高参考价值的属性,并结合该 属性对应的安全数据生成安全数据分析结果,保证了安全数据分析结果的准确性和可靠 性,并且还能够提高安全数据分析效率。 附图说明 图1为本申请实施例提供的安全数据分析方法的应用场景示意图; 图2为本申请实施例提供的安全数据分析方法的流程示意图; 图3为本申请实施例提供的安全数据分析系统的结构示意图; 图4为本申请实施例提供的安全数据分析系统的工作原理示意图; 图5为本申请实施例提供的一种安全数据分析装置的结构示意图; 图6为本申请实施例提供的另一种安全数据分析装置的结构示意图; 图7为本申请实施例提供的服务器的结构示意图; 图8为本申请实施例提供的终端设备的结构示意图。
分享到:
收藏