logo好方法网

基于区域全卷积网络和自适应的跨域目标检测方法


技术摘要:
本发明公开了一种基于区域全卷积网络和自适应的跨域目标检测方法,属于计算机视觉技术领域。本发明使用深度学习目标检测技术,针对目标检测中训练域和测试域的数据不同分布的问题,利用自适应方法来改善目标检测的跨域鲁棒性。首先基于深度学习构建了区域全卷积网络模  全部
背景技术:
目标检测是计算机视觉中的基本问题,它旨在检测和识别图像中对应于某种类别 的所有目标对象。目标检测可追溯到很长一段时间,已经有了许多经典有效的方法。经典工 作通常将目标检测定义为滑动窗口分类问题。在计算机视觉中,深度卷积网络的兴起就起 源于目标检测。在深度卷积网络急速发展的推动下,研究者已经提出了许多基于卷积神经 网络的目标检测算法,大大提高了目标检测性能。在已经提出的大量方法中,区域全卷积网 络由于其有效性而受到了极大的关注。它从图像中提取区域建议网络,并且训练网络以独 立地对每个感兴趣区域进行分类。 然而虽然这些算法在一些基准数据集上获得了优异的性能,但现实世界中的目标 检测仍然面临着挑战,如检测角度,物体外观,背景,明暗,图像质量等方面的巨大差异,这 些差异会导致训练数据与测试数据之间显著的域变换问题。以现在热门的自动驾驶为例, 专业的自动驾驶汽车中使用的摄像机类型和设置可能与用于收集训练数据的摄像机类型 和设置不同,并且汽车可能位于不同的城市,目标的各种外观也会不同,同时自动驾驶系统 需要在不同的天气条件下都能可靠地工作,而训练数据通常是在干燥天气中收集并具有更 好的可见度。研究表明这种域变换会导致目标检测性能显著下降,虽然收集更多的训练数 据可能会减轻这种影响,但这种方案标注边界框代价很高且耗时。 类似的跨域目标检测问题,专利“一种基于多层特征对齐的跨域目标检测方法”提 供了一个解决方案,主要通过在基本卷积网络中加入两个判别器来减少域变换差异。然而 这种方法仅考虑了整体图像层面上的部分域变换差异,作为目标检测任务,目标层面上的 域变换差异也需要考虑。同时,该专利使用的VGG16基本卷积网络性能一般,在目标检测上 使用ResNet101是更好的方案。 因此,我们非常希望开发算法以使目标检测模型来更好地适应现实中的跨域目标 检测的问题。研究发现可以基于目前较先进的区域全卷积网络(R-FCN)模型构建端到端的 深度学习模型,我们可将其作为基础检测器,并提高其在跨域目标检测的泛化能力。 自适应方法目前经常应用于计算机视觉图像分类问题,常规方法包括区域转移多 核学习,非对称度量学习,子空间插值,测地流核,子空间对齐,协方差矩阵对齐等。与这些 工作不同,我们旨在提高深度神经网络的域自适应性,对于目标检测问题,需要预测物体位 置和类别,因此更具挑战性。
技术实现要素:
为了解决跨域目标检测的问题,本发明提供基于区域全卷积网络和自适应的跨域 目标检测方法,使用深度学习目标检测技术,针对目标检测中训练域和测试域的数据不同 4 CN 111553397 A 说 明 书 2/5 页 分布的问题,利用自适应方法来改善目标检测的跨域鲁棒性。为达此目的: 本发明提供基于区域全卷积网络和自适应的跨域目标检测方法,具体步骤如下: (1)构建区域全卷积网络模型,引入图像级别和目标级别的域分类器作为自适应 成分,同时加上一致性正则化器,具体步骤为: 步骤1.1:构建区域全卷积网络模型R-FCN,该网络是一个两级检测器,主要由三个 部分组成: 共享底部卷积层,区域建议网络RPN和基于位置敏感的兴趣区域池化分类器,网络 先将输入图像表示为由共享的底部卷积层产生的卷积特征图,基于该特征图,区域建议网 络生成候选目标区域的建议,之后位置敏感的兴趣区域池化分类器根据使用兴趣区域池化 获得的特征向量来预测类别标签和目标位置坐标,网络的损失函数包括区域建议网络的损 失和兴趣区域池化分类器的损失: L(s,t)=L (s ) λ[c*cls c* >0]Lreg(t,t*) 其中c*是兴趣区域的标签,c*=0表示背景,c*>0表示类别是背景时为0,否则为1, L (s *cls c )=-log(s *c )是分类的交叉熵损失函数,Lreg的部分为边界回归损失函数,使用 smoothL1损失,t*代表了标注的框体相对位置,λ用于平衡两部分的权重; 步骤1.2:在区域全卷积网络模型基本卷积层的特征映射输出后加入图像级别的 域分类器作为自适应成分,为消除图像级别上的域分布不匹配,采用基于补丁的域分类器, 在特征映射的每次激活时训练域分类器,由于每个激活的感受域对应于输入图像的图像 块,因此该域分类器实际上预测每个图像块的域标签,使用交叉熵损失函数,图像级别自适 应损失函数可以写成如下形式: 其中Di=0表示源域,Di=1表示目标域;pi表示分类器的输出; 步骤1.3:在区域全卷积网络模型的最终类别分类器之前,基于位置敏感的兴趣区 域池化特征向量后加入目标级别的域分类器作为自适应成分,与图像级别自适应类似,为 特征向量训练域分类器来,由于每个激活的感受域对应于输入图像的目标块,因此该域分 类器实际上预测每个目标块的域标签,使用交叉熵损失函数,目标级别自适应损失函数可 以写成如下形式: 步骤1.4:在图像级别和目标级别的域分类器上加入一致性正则化,在不同层面上 强制域分类器之间的一致性,有助于学习边框的预测器即区域建议网络的跨域鲁棒性,因 此,进一步加入一致性正则化器; (2)使用对抗性训练策略以及随机梯度下降算法以端到端的方式来训练网络,最 后移除自适应成分并使用区域全卷积网络架构来进行目标检测,具体步骤为: 步骤2.1:在图像级别和目标级别的域分类器之前加入梯度反向层GRL,使用普通 梯度下降来训练域分类器,当通过梯度反向层来优化基础网络时,梯度的符号被反转; 步骤2.2:网络进入训练阶段,对网络模型输入训练数据,使用标准的随机梯度下 降算法以端到端的方式来训练,同时自适应成分通过使用梯度反向层来实现对抗训练,梯 5 CN 111553397 A 说 明 书 3/5 页 度反向层在传播期间自动反转梯度,最终训练损失函数是每个部分的总和,可以写成: L=L(s,t) λ(Limg Lins Lcst) 步骤2.3:用训练好的网络进行目标检测,移除网络模型的所有自适应成分,并使 用具有自适应权重的区域全卷积网络架构完成目标检测任务。 作为本发明进一步改进,所述一致性正则化器的一致性正则化函数可以写成: 其中|I|表示卷积网络的输出特征图的激活输出个数。 有益效果:本发明提供基于区域全卷积网络和自适应的跨域目标检测方法,该方 法使用深度学习目标检测技术,针对目标检测中训练域和测试域的数据不同分布的问题, 利用自适应方法来改善目标检测的跨域鲁棒性。首先基于深度学习构建了区域全卷积网络 模型;接着在图像级别和目标级别上设计了两个相应的域分类器作为自适应成分来减少域 变换的差异,并在域分类器加上一致性正则化;然后以端到端的方式训练网络;最后去掉自 适应成分,将网络用于目标检测任务。采用我们设计的跨域目标检测方法可以有效提高在 各种域变换场景中进行目标检测的平均精度。 附图说明 图1为本发明基于区域全卷积网络和自适应的跨域目标检测方法流程图。 图2为训练阶段有自适应成分的网络模型结构图。 图3为预测阶段无自适应成分的网络模型结构图。 图4为水库模型门螺栓定位检测效果图。 图5为实地水库门螺栓定位检测效果图。 图6为实地水库门螺栓定位检测效果图。 图7为实地水库门螺栓定位检测效果图。
分享到:
收藏