logo好方法网

一种类激活映射方法


技术摘要:
一种类激活映射方法,它属于类激活映射图生成研究技术领域。本发明解决了由于梯度的不稳定性,导致以梯度为权重生成的类激活映射图质量受到影响的问题。本发明将AlexNet模型中最后一层卷积层得到的激活图还原为输入图像大小,通过类似掩膜的处理方式,但不同的是将原始  全部
背景技术:
卷积神经网络在许多实际任务中都表现出巨大的有效性,但当模型出现了错误的 行为,往往会产生无法解释和不连贯的结果,让人怀疑是什么导致神经网络做出这样的决 定。对于普通用户而言,使用深度神经网络模型如同黑盒一般,给它一个输入,其反馈一个 决策结果,没人能确切地知道它背后的决策依据以及它做出的决策是否可靠。因此,缺乏可 解释性已经成为深度学习在现实任务中进一步发展和应用的主要障碍之一。近年来,尽管 网络架构一直在不断简化和合理,因为预测结果无法分解为直观易懂的部分,因此神经网 络的可理解性仍然是一个棘手的问题。图像样本输入到深度学习模型中,模型对输入的图 像样本提取相应的特征进而判断图像的类别。如果能够了解模型提取到的特征是什么,那 么对模型的决策依据就有了一定的解释。从单一图像样本来理解模型的决策,输入样本中 哪些特征信息或者特征区域对模型的决策的结果产生了影响。 2015年,Zhou等人提出了类激活映射图(class  activation  map,CAM)。该方法是 一种生成热力图的技术,用于突出图像的类的特定区域。它定位了输入图像样本中影响模 型决策类别判断的相关重要区域。对于特定的输入,类激活映射的方法能够较为出色的反 映出深模型所关注的区域。通过这种解释图的形式,能够定位出相关决策的重要区域,是一 种比较好的局部解释的方法。 传统的模型进行分类任务时,在特征提取过程中经过全连接层,相应的目标的空 间位置信息就丢弃了,所以Zhou提出了用GAP(global  average  pooling,GAP)来代替全连 接层。该模型网络结构分为两部分,一部分是卷积层的特征提取(CNN),另一部分是分类层 全局平均池化层,在特征提取的最后一层使用全局平均池化,这样GAP将会输出每个激活图 平均值,接下来进行一个加权求和得到最后的输出。那么对应的,可以对最后一层激活图利 用分类层的权值进行加权。这个加权和得到的结果就是类激活映射图。 类激活映射这种类型的解释方法将解释视为来自卷积层的激活图的线性加权组 合。原始CAM必须通过在网络中通过修改模型结构,将原来的全连接层替换成全局平均池化 层,并对网络进行重新训练,这严重限制了其应用。为了克服这些缺陷,Selvaraju提出了 Grad-CAM,基本思想是用梯度的方式作为权重对应于某个分类的激活图的权重,在梯度计 算的过程中加入了全局平均池化的思想,进行了简单的计算来生成梯度值。另外,激活图的 关心区域是对分类有正面影响的特征。所以在线性组合的技术上加入了ReLU激活函数,来 消除负值的影响。后来为了获得更好的解释效果,Chattopadhyay进一步提出了Grad-CAM 的方法,主要对计算权重方法做出了改进,在梯度计算的过程直接中加入了ReLU,将梯度计 算值更加精细化。这两类都是在CAM的基础上进行改进的,主要区别在于如何计算激活图的 权重,但权重的值都是在用梯度表示的,所以这些方法都是基于梯度的解释方法。 4 CN 111553462 A 说 明 书 2/7 页 通过对上述类激活映射的研究发现,无论是Grad-CAM还是Grad-CAM ,这两种类 激活映射的方法都是通过计算梯度来反映出权重的值,从而将来自卷积层的激活图线性加 权得到最终的结果。但是这种通过梯度作为权重的方式存在一定的问题,在反向传播的过 程中,梯度显得非常不稳定。同时梯度对输入值的变化会产生较大改变,当输入图像的值发 生微小变化时,梯度所表现出来急剧变化的问题。所以基于梯度的类激活映射的方法产生 的解释图像可能并不是准确反映某个类别的重要区域。可能存在错误的解释区域。所以这 种以权重为重要性的线性加权方式得到的激活图,往往权重显得尤为重要,权重的准确计 算直接影响到最终的类激活映射图的生成质量。
技术实现要素:
本发明的目的是为解决由于梯度的不稳定性,导致以梯度为权重生成的类激活映 射图质量受到影响的问题,而提出了一种Acc-CAM类激活映射方法。 本发明为解决上述技术问题采取的技术方案是:一种Acc-CAM类激活映射方法,该 方法包括以下步骤: 步骤一、建立AlexNet模型,所述AlexNet模型的网络结构包括若干个卷积层和若 干个全连接层,且在最后一层全连接层后面连接着Softmax函数; 步骤二、将单一原始图像样本输入已训练好的AlexNet模型,通过AlexNet模型的 卷积层提取出N个原始激活图后,再将提取出的N个原始激活图分别还原为原始图像样本的 尺寸,得到N个尺寸还原后的激活图,其中,N为AlexNet模型的最后一层卷积层中卷积核的 个数; 步骤三、分别对每个尺寸还原后的激活图进行图像内像素的归一化处理,得到N个 归一化处理后的激活图; 步骤四、对于归一化处理后的激活图S′k,k=1,2,…,N,将激活图S′k中的各像素分 别与原始图像样本中对应位置的像素进行点积操作,得到激活图S′k对应的掩膜图像Mk; 再将生成的掩膜图像M1 ,M2,M3,...,MN分别输入到已训练好的AlexNet模型中,通 过Softmax函数的输出获得N个原始激活图的权重; 步骤五、利用步骤四获得的N个原始激活图的权重,将尺寸还原后的N个激活图进 行线性加权组合获得最终的类激活映射图。 本发明的有益效果是:本发明提出了一种Acc-CAM类激活映射方法,本发明提出的 方法是基于扰动的思想,将AlexNet模型中最后一层卷积层得到的激活图还原为输入图像 大小,通过类似掩膜的处理方式,但不同的是将原始输入图像的像素值与还原同等尺寸大 小的激活图中对应像素值进行点乘操作,再将生成的掩膜图像样本输入到AlexNet模型中, 经过Softmax函数得到各个掩膜图像样本的值,将得到的掩膜图像样本的值作为对应激活 图的权重值。再将还原同等尺寸大小的激活图与权重进行线性加权,得到最终的Acc-CAM类 激活映射图。 与现有以梯度为权重的方法相比,本发明方法获得的权重的精确度可以提高5% 以上,生成的类激活映射图的质量更好,可以更好地理解卷积神经网络模型的决策。 5 CN 111553462 A 说 明 书 3/7 页 附图说明 图1是AlexNet模型结构图; 图中,Max  pooling代表卷积层后的池化操作,dense代表全连接层,Stride代表步 长; 图2是激活图提取的示意图; 图3是反卷积操作图; 图4是Acc-CAM类激活映射图的计算流程图; 图5是Softmax函数对应的图像。
下载此资料需消耗2积分,
分享到:
收藏