logo好方法网

无监督聚类异常检测的方法


技术摘要:
本公开提供一种无监督聚类异常检测的方法,涉及航天器异常检测方法,能够解决目前航天器运行的精确物理解析模型,过多依赖于航天器系统的先验知识,在实际应用中模型难以建立、知识难以获取等的问题。具体技术方案为:利用已积累的航天器大量正常状态数据,从样本数据  全部
背景技术:
由于在轨卫星长期运行在复杂、恶劣的空间环境中,受到多种不确定性因素的影 响,其性能与功能可能会出现变化,反映在遥测参数上也会有所变化,如果在轨卫星发生异 常,相应的遥测参数也会发生变化。因此,分析在轨卫星遥测数据的变化规律,研究在轨卫 星异常检测方法,提早发现在轨卫星异常征兆,提前采取措施避免可能发生的重大故障,降 低卫星在轨运行风险,对提高卫星在轨运行的安全性和可靠性具有重要的意义; 工程中对航天器异常检测方法主要包括基于知识的门限检测方法和基于物理模 型的方法。门限检测方法简单、易于实现,但在实际中很难给出合理的门限范围,而且由于 门限是预先给定的,因此无法检测未知故障。基于模型的故障检测方法通过建立系统正常 状态的解析模型,利用数学模型和观测输入输出量的残差来检测系统异常或故障,但是目 前很难建立航天器运行的精确物理解析模型。无论门限检测方法还是基于模型的方法,这 些方法都过多依赖于航天器系统的先验知识,在实际应用中存在模型难以建立、知识难以 获取等问题。
技术实现要素:
本公开实施例提供一种无监督聚类异常检测的方法,能够解决过多依赖于航天器 系统的先验知识,在实际应用中模型难以建立、知识难以获取等的问题。所述技术方案如 下: 根据本公开实施例提供一种无监督聚类异常检测的方法,该方法包括: 对n个原始遥测数据第K个遥测数据建立等时间间隔第K个目标遥测数据序列,第K 个目标遥测数据序列经过时标对齐获得第K个目标遥测数据; 优选地,第K个目标遥测数据序列经过时标对齐获得第K个目标遥测数据;为,判断 所述第K个目标遥测数据的数据类型,按照所述第K个目标遥测数据序列的时标,在所述n个 原始序列记录数据中获取所述第K个目标遥测数据,得到赋值后所述第K个目标遥测数据序 列; 第K个目标遥测数据经过标准化处理后获得所述目标遥测数据的数据向量X,所述 第K个目标遥测数据的数据向量X的各个分量进行时标对齐后,通过Single-Linkage聚类方 法建模,获得聚类模型集S; 优选地,第K个目标遥测数据经过标准化处理为,采用Z-score方法进行标准化处 理获得目标遥测数据集D; 第K个目标遥测数据集D至少一个所述目标遥测数据子集D′,与所述聚类模型集S 之间的距离,获得所述第K个目标遥测数据的检测门限阈值; 5 CN 111612048 A 说 明 书 2/10 页 优选地,第K个目标遥测数据的数据向量X到所述聚类模型集S中的每一个聚类的 距离计算获得最小距离,所述最小距离超出所述检测门限阈值,所述第K个目标遥测数据为 异常。 在一个实施例中,对n个原始遥测数据第K个遥测数据建立等时间间隔第K个目标 遥测数据序列前, 还包括,对n个原始遥测数据设定时间间隔td,建立等时间间隔采用获得第K个目 标遥测数据序列x(t),设定第K个目标遥测序列起始时间ts,时间间隔td,tdsim(X,Ci); 如果sim(X,C)>α,将第K个目标遥测数据向量X加入所述聚类C;否则,创建一个新 的聚类Cn,将第K个目标遥测数据向量X加入类聚类Cn,将聚类Cn加入所述聚类模型集S,其 中,α为最大允许的聚类半径r的倒数,即α=1/r。 优选地,聚类模型集S将K个目标遥测数据向量X循环加入集合S,形成所述聚类模 型集S,获得所述聚类模型集S的每个聚类的中心点Oi和最大半径Ri,其中j=1,2,…,l。 在一个实施例中,检测门限阈值为集合的平均值与3倍标准差之和; 其中,第K个目标遥测数据集D的子集D2计算D2中的每个数据向数据向量 与所 述聚类模型集S之间的距离,得到距离集合{di,i=1,2,3,…,n},n为数据集D2中数据向量 的个数,计算距离集合{di,i=1,2,3,…,n}的平均值 和标准差 获取检测门限阈值为距离集合的平均值和3倍的标准差β=μ 3σ。 优选地,第K个目标遥测数据的数据向量X到聚类模型集S中的每一个聚类的距离 计算获得最小距离,最小距离超出所述检测门限阈值,第K个目标遥测数据为异常; 其中,第K个目标遥测数据的数据向量的各个分量进行时标对齐,X进行Z-score标 准化处理,所述标准化处理后的数据向量X到聚类模型集S中的每一个聚类Cj的距离zj=dis (X,Oj)-Rj,j=1,2,…,l; 计算获得最小距离zmin=min{zj,j=1,2,…,l}; 若最小距离zmin>β,第K个目标遥测数据为异常。 本公开实施例提供的本公开一种无监督聚类异常检测的方法,利用已积累的航天 器大量正常状态数据,从样本数据中时标对齐、等间隔采样,生成样本数据,基于归纳学习 的思想,通过无监督聚类分析建立航天器正常状态数据模型。利用聚类结果计算样本数据 的最小距离,统计分析样本数据的最小距离集,利用高斯分布建立遥测数据异常检测的门 限阈值,通过判断航天器实时观测数据与正常状态数据模型之间的偏离程度,实现异常数 据检测。有利于从航天器遥测参数时间序列数据中发现异常数据,有利于辅助航天器异常 分析时的参数排查定位。 应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不 7 CN 111612048 A 说 明 书 4/10 页 能限制本公开。 附图说明 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施 例,并与说明书一起用于解释本公开的原理。 图1是本公开实施例提供的一种无监督聚类异常检测的方法的流程示意图; 图2是本公开实施例提供一种无监督聚类异常检测的方法应用案例最小距离序列 图; 图3是本公开实施例提供一种标对齐与等间隔样本序列生成逻辑示意图 图4是本公开实施例提供一种无监督聚类异常检测的方法建模样本准备应用逻辑 示意图; 图5是本公开实施例提一种无监督聚类异常检测的方法Single-Linkage聚类建模 应用逻辑示意图; 图6是本公开实施例提供一种无监督聚类异常检测的方法检测门限阈值逻辑示意 图; 图7是本公开实施例提供一种无监督聚类异常检测的方法检测门限阈值检测异常 数据逻辑示意图。
分享到:
收藏