logo好方法网

基于网格细胞记忆的HOG算法图像识别方法


技术摘要:
本发明公开了一种基于网格细胞记忆的HOG算法图像识别方法,包括建立基于网格细胞记忆的HOG算法图像识别系统,先通过HOG算法模块匹配到相似度能达到激活识别细胞的图像,若匹配到测试集中相应图像激活了识别细胞,识别结束;如果测试集中图像无法激活识别细胞,则由网格  全部
背景技术:
深度学习或ANNs通过将海量的训练数据集输入大型的ANNs从而取得了非凡的效 果。比如当深度学习模型通过海量的训练样例不断学习后,确实能够以非常高的精确率去 识别人的脸或者某些特殊场景等。但是人们期望ANNs或深度学习模型能够利用少量的样本 学习到新类别的特征,更好地模仿人类从小样本数据中学习类型特征的能力。
技术实现要素:
有鉴于此,本发明的目的是提供一种基于网格细胞记忆的HOG算法图像识别方法, 已解决现有人工智能识别图像需要依赖赖大数据训练样本以及超大功耗的技术问题。 本发明基于网格细胞记忆的HOG算法图像识别方法,包括建立基于网格细胞记忆 的HOG算法图像识别系统,所述的基于网格细胞记忆的HOG算法图像识别系统包括HOG算法 模块和网格细胞记忆模型,所述网格细胞记忆模型包括: 网格细胞,其用来锚定给定刺激的每个特征,刺激即输入图像,所锚定的特征在所 有网格上编码的特征的相对位置是相互一致的; 距离细胞,其用来计算由网格细胞群矢量编码的位点之间的位移矢量; 感觉细胞,即特征检测器,其为在可能的图像的像素值上具有高斯调谐曲线的细 胞; 标签细胞,其由特征检测器驱动,为特征的标签单元,提供识别证据,驱动其相关 的刺激识别细胞,产生关于刺激识别的相互竞争的假设。 识别细胞,其为表示刺激的组成特征的少量特征标签单元接收连接,和标签细胞 双向连接,并且具有到相同特征标签单元的则返回映射,识别细胞的放电率作为识别的判 据。 先通过HOG算法模块识别图像,如果HOG算法模块匹配到相似度能达到激活识别细 胞的图像,识别结束;如果HOG算法模块没有匹配到训练集中图像能激活识别细胞,则由网 格细胞记忆模型接管图像识别,通过网格细胞记忆的特征识别累加来达到激活识别细胞, 完成图像识别。 进一步,所述的网格细胞记忆模型通过以下步骤进行训练: 1)在训练图像上选择若干个刺激位置,并对选中位置的坐标进行保存,每选择一 个位置及产生一个中央凹; 2)根据保存的坐标对每个中央凹提取一个中央凹特征,中央凹特征的位置由网格 细胞种群向量表示; 3)每个中央凹特征在感觉细胞之间产生特征响应; 4)感觉细胞和标签细胞之间hebbian关联; 6 CN 111598110 A 说 明 书 2/11 页 5)标签细胞与网格细胞种群向量表示的位置连接; 6)标签细胞与识别细胞双向关联; 7)保存网格细胞相关记忆和各细胞间的连接权值。 进一步,通过HOG算法模块匹配激活识别细胞的图像的步骤包括: I)把被识别图像转化为灰度图; II)计算被识别图像的梯度方向; III)编码被识别图像的局部特征区域,在每个细胞中统计所有像素的梯度直方 图,得到每个细胞形成的特征向量; IV)通过单个细胞组成大的块,每个块有2*2个细胞,块内归一化梯度直方图,得到 最后的特征向量; V)设定能激活识别细胞的相似度设定值,并通过HOG算法提取被识别图像和训练 集的特征向量,然后求被识别图像的特征向量和训练集的特征向量的相似度; 当求得的被识别图像的特征向量和训练集的特征向量的相似度大于相识度设定 值时则识别细胞会被成功激活,识别结束。 进一步,当求得的测试图像的特征向量和训练集的特征向量的相似度无法达到相 识度设定值时,将求得的相似度作为基准值H,并由网格细胞记忆模型接管图像识别,网格 细胞记忆模型识别图像包括步骤: a)把被识别图像转换为灰度图像,在被识别图像上随机选择一个在训练时选择的 刺激位置来作为眼扫起点,开始眼扫; b)提取中央凹特征; c)特征检测器驱动标签细胞; d)标签细胞驱动与其相关的识别细胞,中央凹的当前位置由网格细胞活动的种群 向量表示,该种群向量通过眼扫运动进行更新; e)眼扫过程中标签细胞驱动与其相关的识别细胞,产生关于刺激识别的相互竞 争,将刺激的不同部分转移到中央凹;一旦有一个识别细胞的放电率达到识别阈值或眼扫 次数达到设定次数而终止识别,表示成功识别出此图像的置信值为C;否则网格细胞驱动的 记忆识别接管识别任务,先前激活的标签细胞重置为零,最活跃的识别细胞通过其返回投 影随机选择下一个标签细胞,随机性由反投影上的弱噪声给出,动态选择标签细胞,标签细 胞又与其自身的网格细胞种群向量相关联,产生下一个眼扫向量的目标点,距离细胞系统 输出更新中央凹位置所需的向量,给定下一个眼扫的起点和终点,从而产生下个刺激特征 的位置继续眼扫; f)将基准值H和置信度C的和与相识度设定值进行比较,判断是否能激活相应的激 活细胞。 进一步,在训练时图像的像素大小为440*440与网格细胞的大小映射一致,网格细 胞的模型被实现为作为查找表的标准触发率图,每张标准触发率图都由一个与环境图尺寸 相同的矩阵组成,网格细胞作为查找表时其设计使用以下方程组(1)计算60度偏移、叠加余 弦波: 7 CN 111598110 A 说 明 书 3/11 页 式中b0,b1和b2是余弦波的法向量,使用9个方向恒定的模块,F是网格的空间频 率,rGC为网格细胞的放电率。 进一步,所述步骤1)在训练图像上选择9个刺激位置,即产生了9个刺激特征中央 凹,每一个中央凹的大小为61*61的矩阵,每一个中央凹参与特征编码的细胞与当前网格细 胞群向量和单个识别细胞相关联;中央凹提取的一个特征FPCs大小为[ls*ls,1]矩阵,这里 ls为61则FPCs大小为3721*1;每个中央凹特征在特征检测器之间产生特征响应,感觉细胞 即特征检测器SCs对FPCs处理得到[ls*ls*256,1]的矩阵,处理方式通过高斯模糊计算得 到。 进一步,所述步骤7)保存网格细胞相关记忆和各细胞间的连接权值,标签细胞 PLCs为[N*M,1]的矩阵,N为训练图片的种类数,M为每类图片的刺激中央凹的个数;识别细 胞PRCs大小为[N,1];当前位置网格细胞cGCs以及目标位置网格细胞tGCs大小为[K,1]的矩 阵,K的大小为900;感觉细胞到标签细胞权值SC_2_PLC_w为[N*M,ls*ls*256],识别细胞到 标签细胞权值PRC_2_PLC_w为[N*M,N];特征提取到标签细胞权值FPC_2_PLC_w为[N*M,ls* ls];网格细胞到特征标签的权重GC_2_PLC_w为[N*M,K];训练时细胞间的相关权重计算如 公式(2): 进一步,在步骤a)中把被识别图像转换为灰度图像采用公式(3)Gamma压缩公式,I (x,y)代表像素点的灰度值,Gamma取1/2; I(x,y)=I(x,y)gamma     (3) 公式(3)中I(x,y)代表像素点的灰度值,则梯度的方向为(x,y),其计算方式如下, x,y的两个方向的梯度分量分别用向量[-1,0,1]和向量[-1,0,1]的转置的梯度算子和原图 像进行相关卷积梯度运算;其I(x,y)像素点的梯度大小和方向角如公式(4)所示: 8 CN 111598110 A 说 明 书 4/11 页 公式(4)中,G(x,y)表示为图中像素点的梯度幅值的标量大小,θ(x,y)代表梯度的 方向角; 编码图像的局部特征区域,将图像均分割为8*8个像素的细胞,接着每个细胞内0- 180°的梯度方向均分成为9个区间,然后在每个细胞中统计下所有像素的梯度直方图,得到 每个细胞形成的9维的特征向量;将单个细胞组成大的块,每个块有2*2个细胞,从而形成的 特征向量为36维,利用的L2-norm的方式完成对整个块块内归一化梯度直方图,得到最后的 特征向量。 进一步,所述步骤V)中求是利用公式(5)被识别图像的特征向量和训练集的特征 向量的相似度corr2: 公式(5)中A表示训练数据特征向量,B表示测试数据特征向量;测试时设定相似度 大于0.7识别细胞才能被激活。 进一步,在步骤e)中,识别细胞在各个眼扫周期中累积放电如公式(6)所示: 公式(6)中:FC为特征检测器驱动特征标签细胞,该细胞匹配所关注的特征; Softmax操作确保了标签细胞之间的代码稀疏,标签细胞驱动其相关的识别细胞,产生关于 刺激识别的相互竞争的假设incr,PRCs是根据眼扫的特征不断在累加的;FLC2ID为常数连 接因子,表示标签细胞到ID细胞的连接强度,如果FLC2ID较高,则眼扫特征较少。 本发明的有益效果: 本发明基于网格细胞记忆的HOG算法图像识别方法,其中的基于网格细胞记忆的 HOG算法图像识别系统一旦学会了必要的关联,它的识别记忆就会通过呈现训练集中的刺 激进行测试。本发明图像识别方法属于小样本学习模型,同时算法有解决HOG无法处理遮挡 带来的问题的潜力。基于网格细胞记忆的HOG算法图像识别学习是借鉴视觉驱动的网格细 胞通过编码特征间的运动矢量,捕捉刺激特定坐标系中复合刺激的布局,来支持识别记忆, 从而达到单样本学习的图像分类识别。本发明基于网格细胞记忆的HOG算法图像识别方法 中的训练集是单样本学习,通过呈现记忆时的刺激来,达到小样本学习的效果,解决了现有 人工智能识别图像需要依赖赖大数据训练样本以及超大功耗的技术问题。同时本发明图像 识别方法也模仿了人的大脑机制,完成了类脑神经网络的小样本学习。而且本发明还对HOG 算法进行了优化。 附图说明 图1为基于网格细胞记忆的HOG算法图像识别模型; 图2为基于网格细胞记忆的图像识别系统模型训练流程图; 9 CN 111598110 A 说 明 书 5/11 页 图3为基于网格细胞记忆的HOG算法识别的测试流程图; 图4为训练图像和测试图像的特征向量; 图5中(a)为测试图的网格细胞记忆识别中网格驱动的第二次重置眼扫,(b)为测 试图的网格细胞记忆识别中网格驱动的第三次重置眼扫。 图6为测试图的网格细胞记忆识别中激活的特征标签细胞。 图7为测试图的网格细胞记忆识别中累加的识别细胞。 图8中测试图的网格细胞记忆识别中测试图,(a)为测试图A(类别2),b)测试图B (类别8)。 图9为训练图。 图10为测试图。
分享到:
收藏