技术摘要:
传统子空间聚类问题并没有考虑序列数据的特性,即相邻帧序列样本具有一定的相似性,针对这一问题,本发明提出了一种新的低秩稀疏空间子空间聚类方法(Low Rank and Sparse Spatial Subspace Clustering for Sequential Data,LRS3C)。该算法寻找序列数据矩阵的稀疏低秩 全部
背景技术:
序列数据的子空间聚类问题,是计算机视觉领域中一个重要但又具有挑战性的问 题。假设这类数据在时间或空间的特定点以均匀的间隔采样,也就是时间序列数据。例如, 作为时间函数的视频数据具有序列结构,在该结构中,可以假设大多数帧与其相邻帧相似, 直到场景发生变化。 子空间聚类是解决高维数据聚类的有效方法之一,其基本假设是高维数据往往存 在于低维子空间的并集中。近年来,利用稀疏表示或低秩表示进行子空间聚类的研究受到 广泛关注,并提出了一系列与之相关的新的子空间聚类算法,如稀疏子空间聚类(SSC)、低 秩表示(LRR)及其变体低秩稀疏子空间聚类算法(LRSC)。这些算法的基本假设是数据是自 表达的(即其子空间中的每个数据点可以表示为来自同一子空间的数据点的线性组合)。其 中,基于表示矩阵核范数和L1范数最小化的LRR和SSC算法最受关注。这些算法主要是针对 不连续的独立数据进行设计开发的,并没有特别考虑到处理时间序列数据的特殊性。此外, 在时间序列数据的子空间聚类问题上,研究人员所做的工作并不是特别充分。
技术实现要素:
针对上述问题,本发明通过有效利用数据序列的性质,提出了一种低秩稀疏空间 子空间聚类方法(Low Rank and Sparse Spatial Subspace Clustering for Sequential Data,LRS3C)。具体地说,在子空间聚类算法模型中加入了一个惩罚项来加强近邻数据的相 似性。采用交替方向乘子法(ADMM)求解优化问题。在视频场景分割和人脸聚类的实际问题 中,实验结果表明,该方法具有良好的性能。 一种低秩稀疏空间子空间聚类方法,包括如下步骤: 步骤1,设定目标函数作为优化问题; 步骤2,使用交替方向乘子器ADMM方法解决目标函数优化问题;首先引入两个辅助 项,并得到辅助项的增广拉格朗日方程,通过固定变量,分别交替优化求解辅助项以解决优 化问题; 步骤3,在解决上述优化问题后,得到数据矩阵的低秩稀疏表示系数矩阵Z,使用表 示系数矩阵构造亲和图,利用谱聚类算法对亲和图进行分割,得到最终聚类结果。 进一步的,步骤1中,所述目标函数为: s.t.X=XZ E 第一项是用最小二乘法测量误差E,即 相当于假设误差来自标准高斯分布, 5 CN 111553416 A 说 明 书 2/7 页 其余三项是对系数矩阵Z的约束,包括低秩稀疏光滑邻域目标,其中低秩性由||Z||*控制, 稀疏度由||Z||1控制,平滑度由||ZR||2,1控制,参数λ1、λ2和λ3决定正则化的强度。 进一步的,目标函数中,||ZR||2,1作为一个惩罚项来控制近邻样本数据的相似性。 进一步的,步骤2中,为进一步分离变量Z的项,引入两个辅助项S=Z=Z1=Z2和U= SR,然后得到引入两个辅助项的增广拉格朗日方程如下: 通过固定其他变量,分别交替优化求解Z1,Z2,S和U。 进一步的,步骤2中,固定变量Z2,S和U,通过求解下列优化问题得到变量Z1; 经过变换,该优化问题可以写成如下形式: 定义软阈值操作符πβ(X)=(|X|-β) sgn(X)和奇异值软阈值操作符∏β(X)=Uπβ (Σ)VT,其中,U∑VT是矩阵A的skinnySVD分解; 最终得Z1的更新规则为: 进一步的,步骤2中,固定变量Z1,S和U,通过求解下列优化问题得到变量Z2; 经过变换,该优化问题写成如下形式: 最终得Z2的更新规则为: Z2=Z2-diag(Z2) 进一步的,步骤2中,固定变量Z1,Z2和U,通过求解下列优化问题得到变量S; 6 CN 111553416 A 说 明 书 3/7 页 将上述目标函数关于S的导数设为零,得到: (XTX (r r )I)S r SRRT1 2 3 = XTX r3URT r1Z1 r2Z2 G E FRT 将上述线性矩阵方程矢量化为如下形式: 其中 表示张量积。 进一步的,步骤2中,固定变量Z1,Z2和S,通过求解下列优化问题得到变量U; 经过变换,该优化问题写成如下形式: 令 则上述优化问题有闭式解,表示如下: 其中,U(:,i)和M(:,i)分别是U和M的第i行。 进一步的,步骤2中,变量G更新规则: G=Gold r1(Z1-S) 变量E更新规则: E=Eold r2(Z2-S) 变量F更新规则: F=Fold r3(U-SR) 参数r1,r2,r3更新规则如下: 进一步的,所述步骤3中,具体为建立一个加权图Graph=(v,ε,W),其中W=|Z| |Z |T,然后将谱聚类应用于亲和图,得到最终的聚类结果。 本发明的友谊效果为: (1)本发明在算法框架中同时利用稀疏表示和低秩表示,将两种算法的优势结合 在一起,保证了算法能够充分挖掘数据的全局结构信息,同时满足了后续谱聚类处理的要 7 CN 111553416 A 说 明 书 4/7 页 求。 (2)本发明针对序列数据的特点,在算法模型框架中引入了一个惩罚项来加强近 邻数据样本的相似性,从而为序列数据带来更好的聚类效果。 附图说明 图1是本发明实施例中仿真实验各对比算法使用合成数据集得到的表示系数矩阵 z的示例。 图2是本发明实施例中各对比算法在合成数据集上的聚类结果。 图3是本发明实施例中视频场景分割示例图:给定一系列视频帧,目的是将相似帧 聚类到同一场景。 图4是本发明实施例中不同量级高斯噪声条件下视频数据集的误分类结果表。 图5是本发明实施例中人脸聚类示例图:给定一组有序的人脸图像,目标是对属于 同一个体的图像进行聚类。 图6是本发明实施例中不同高斯噪声强度人脸聚类数据集的误分类结果表。