技术摘要:
本发明涉及网络安全领域,尤其涉及一种基于电网大数据的网络安全态势智能预测方法,包括:对系统运行态势数据预处理,得到时间序列数据;基于LSTM神经网络模型对时间序列数据进行训练得到网络安全态势预测模型;基于SVM分类器对时间序列数据进行训练得到网络安全态势评 全部
背景技术:
基于先进的信息技术和通信技术的智能电网大大提高了电网的可靠性、安全性和 效率,但是也将网络安全威胁引入智能电网。网络攻击会扰乱电力系统的正常运行,给国民 生产带来巨大破坏。许多网络攻击持续时间很短,导致现有的安全防御机制难以发现,并且 发现之后采取行动抵御常常为时己晚,因此给智能电网带来巨大的安全挑战。 智能电网中的广域电力系统的网络组件(例如,交换机、路由器)和安全组件(例如 IDS、访问控制系统)可以生成与网络安全相关的大数据。这些大数据已经为实现安全态势 感知提供了数据资源。 目前,针对智能电网的安全态势还存在一些困难。首先由于智能电网的体系结构 包括基于各种特殊标准的广域异构网络,如IEC 61850,ISO/IEC/IEEE 21451 ,Wireless- hart,ISA100.11 A等,因此很难融合所有的网络安全信息。其次,智能电网的信息建模和通 信与电力系统的复杂行为和智能决策紧密结合。另外,智能电网目前涉及更多新的网络模 型,这将增强智能电网的复杂性,并扩大智能电网的攻击面。此外,大多数网络攻击都是通 过分布式方法产生的,这给使用简单的数据融合机制监控整个网络安全状况带来了困难。 最后,在复杂的网络环境中,由于随机性和不确定性,安全态势感知是一个复杂的非线性过 程,因此基于简单统计数据的一个复杂的非线性过程,因此基于简单统计数据预测方法不 能解决上述问题。
技术实现要素:
为解决上述问题,本发明提出一种基于电网大数据的网络安全态势智能预测方 法。 一种基于电网大数据的网络安全态势智能预测方法,包括: 对系统运行态势数据预处理,得到时间序列数据; 基于LSTM神经网络模型对时间序列数据进行训练得到网络安全态势预测模型; 基于SVM分类器对时间序列数据进行训练得到网络安全态势评估模型; 获取系统运行实时数据并进行预处理; 将预处理后的当前时间段内的系统运行态势数据输入网络安全态势预测模型,得 到网络安全态势预测数据; 将网络安全态势预测数据输入网络安全态势评估模型,对下一个时间段内的系统 网络安全等级进行预测。 优选的,所述对系统运行态势数据预处理,得到时间序列数据包括: 对采集的系统运行态势数据进行清洗、归一化处理,然后进行特征降维处理; 4 CN 111585948 A 说 明 书 2/5 页 利用FP-Growth关联分析算法对降维处理后的数据进行数据分析; 利用mapreduce模型对数据分析后的数据进行特征量化,得到相应的时间序列数 据。 优选的,所述对采集的系统运行态势数据进行清洗、归一化处理,然后进行特征降 维处理包括: 数据清洗:对流量数据X1、审计数据X2、监测数据X3、日志数据X4、病毒数据X5、安全 情报X6、资产数据X7分别设置对应数据阈值θimin、θimax,其中θimin表示第i类数据的阈值最小 值,θimax表示第i类数据的阈值最大值,使θimin≤Xi≤θimax,剔除不必要的数据; 数据归一化:对数据清洗处理后的数据进行归一化: 其中i=1,2...7,Xi表示第i类数据,Ximin表示第i类数据的最小值,Ximax表示第i类 数据的最大值; 数据降维:利用PCA算法对数据Xi进行降维处理。 优选的,所述利用mapreduce模型对数据分析后的数据进行特征量化,得到相应的 时间序列数据包括: 根据系统运行态势数据确定数据Xi中各项数据指标的异常数据求平均值作为异 常值判定的阈值,形成异常值库W,该异常值库中字典D(j,value)i表示Xi的集合中第j项指 标的标准值为value; 将数据Xi与已有的异常值库W中的数据进行比较,如果大于异常值库W中的数据则 为危险状态,如果小于异常值库W中的数据,则为相对安全状态; 对数据Xi与异常值库W中的数据归一化,其中的数值在[0,1]之间得到对应数据的 特征向量Xi',经过特征量化后时间T的数据Xi'压缩为长度为li的数据Zi。 优选的,所述基于LSTM神经网络对时间序列数据进行训练得到网络安全态势预测 模型包括: 将时间序列数据输入到LSTM神经网络模型,利用迁移学习算法得到微调模型训练 参数,得到网络安全态势预测模型。 优选的,所述LSTM网络模型的神经元数量分别为8,16,32,在最后加入长度为li的 全连接层,输出长度为li的数据Oi。 优选的,所述基于SVM分类器对时间序列数据进行训练得到网络安全态势评估模 型包括: 对系统网络安全的态势进行分等级,预测结果区间[0,0 .6]、[0 .6 ,1 .2]、[1 .2 , 1.8]、[1.8,2.4]、[2.4,3.0]分别对应的威胁等级为微弱、弱、中等、强、严重,安全影响程度 αi对应的数值为α1~α4为0.3、α5为0.4、α6为0.6和α7为0.8; 将时间序列数据输入到SVM分类器中,获得7个SVM分类结果Yi,对Yi的指标按照对 系统网络安全影响程度αi加权,获得最后的总体分类结果: 5 CN 111585948 A 说 明 书 3/5 页 根据总体分类结果进而得到安全的等级,利用监督学习算法进行训练得到网络安 全态势评估模型。 通过使用本发明,可以实现以下效果: 基于LSTM神经网络模型对时间序列数据进行训练得到网络安全态势预测模型,基 于SVM分类器对时间序列数据进行训练得到网络安全态势评估模型,实现对下一个时间段 内的系统网络安全等级进行预测; 对系统运行态势数据预处理,提高模型训练的准确度,从而提高系统网络安全等 级预测的准确度。 附图说明 下面结合附图和