技术摘要:
本发明提供一种基于胶囊网络的遥感图像分类方法,所述遥感图像分类方法包括以下步骤:输入原始遥感图像;将所述原始遥感图像处理成像素一致的样本集;从所述样本集中划分出训练集和测试集;搭建VGG16‑胶囊网络模型;训练所述VGG16‑胶囊网络模型;利用训练好的VGG16‑ 全部
背景技术:
随着遥感技术的发展,现有技术已经能很容易地获取各种不同类型的高分辨遥感 图像,如多/高光谱和合成孔径雷达,从遥感图像中可以挖掘出城市环境、交通、水文、气象 和军事等有用信息,因此,有效地理解遥感图像的内容就显得尤为重要,对遥感图像的智能 识别和分类方法的要求也越来越高。近年来,深度学习方法被广泛应用于图像处理领域,深 度学习方法在医学、水文、城市环境等领域的图像处理中也取得了令人瞩目的成绩。 现有技术中,基于卷积神经网络的遥感图像分类方法不断被提出,并取得了不错 的分类结果。虽然基于卷积神经网络的分类方法能显著提高分类精度,但是由于传统的卷 积神经网络模型中使用的全连接层并不能充分地利用图片的空间结构信息,从而使得有一 些场景很难被正确分类出来,仍然容易出现分类错误的情况。 胶囊网络(CapsNet)中使用PrimaryCaps层和DigitCaps层代替传统卷积神经网络 的全连接层,使用一组神经元作为胶囊来代替传统卷积神经网络中的一个神经元,采用这 种方法,能够解决传统卷积神经网络不能有效捕捉遥感图像层次结构的问题。但是现有的 胶囊网络中卷积层的设计并不能有效提取到合适的高级特征,分类效果比较差。
技术实现要素:
本发明提供了一种基于胶囊网络的遥感图像分类方法,以解决现有技术中存在的 不能有效捕捉遥感图像层次结构以及不能有效提取到合适的高级特征,分类效果较差的问 题。 本发明提供一种基于胶囊网络的遥感图像分类方法,所述遥感图像分类方法包括 以下步骤: 输入原始遥感图像; 将所述原始遥感图像处理成像素一致的样本集; 从所述样本集中划分出训练集和测试集; 搭建VGG16-胶囊网络模型; 训练所述VGG16-胶囊网络模型; 利用训练好的VGG16-胶囊网络模型对所述测试集进行分类。 可选的,搭建VGG16-胶囊网络模型的方法主要包括: 删除VGG16网络的最后三层全连接层; 在所述最后三层全连接层的位置添加胶囊网络层; 删除所述VGG16网络的最后一个池化层; 让所述VGG16网络的最后一个卷积层的输出结果作为所述胶囊网络层的输入; 4 CN 111598140 A 说 明 书 2/7 页 VGG16-胶囊网络模型搭建完成。 采用上述技术方案,搭建好的VGG16网络模型除输入层和输出层外,总共19层。 可选的,所述VGG16胶囊网络模型主要包括: 卷积层Conv1,所述卷积层Conv1有64个步长为1,大小为3*3*C的卷积核,其中,C为 通道数; 卷积层Conv2,所述卷积层Conv2有64个步长为1,大小为3*3*C的卷积核,其中,C为 通道数; 最大池化层Pool1,所述最大池化层Pool1的尺寸为2*2,步长为2; 卷积层Conv3,所述卷积层Conv3有128个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 卷积层Conv4,所述卷积层Conv4有128个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 最大池化层Pool2,所述最大池化层Pool1的尺寸为2*2,步长为2; 卷积层Conv5,所述卷积层Conv5有256个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 卷积层Conv6,所述卷积层Conv6有256个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 卷积层Conv7,所述卷积层Conv7有256个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 最大池化层Pool3,所述最大池化层Pool3的尺寸为2*2,步长为2; 卷积层Conv8,所述卷积层Conv8有512个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 卷积层Conv9,所述卷积层Conv9有512个步长为1,大小为3*3*C的卷积核,其中,C 为通道数; 卷积层Conv10,所述卷积层Conv10有512个步长为1,大小为3*3*C的卷积核,其中, C为通道数; 最大池化层Pool4,所述最大池化层Pool4的尺寸为2*2,步长为2; 卷积层Conv11,所述卷积层Conv11有512个步长为1,大小为3*3*C的卷积核,其中, C为通道数; 卷积层Conv12,所述卷积层Conv12有512个步长为1,大小为3*3*C的卷积核,其中, C为通道数; 卷积层Conv13,所述卷积层Conv13有512个步长为1,大小为3*3*C的卷积核,其中, C为通道数; PrimaryCaps层,使用8个并行的卷积层对上一层的输出进行卷积运算;并将计算 得到张量转化为1152个维度为8的向量,作为下一层的输入; DigitCaps层,将上一层的输出通过动态路由算法以及非线性压缩函数转换成K* 16维的向量组,其中,K为待分类的类别数。 上述技术方案中,所有卷积层均通过设置padding=1,使得输出的特征大小和输 入的尺寸一致;所有最大池化层均采用最大池化操作。 5 CN 111598140 A 说 明 书 3/7 页 可选的,训练所述VGG16-胶囊网络模型的方法包括以下步骤: 将所述训练集中的若干遥感图像输入搭建好的所述VGG16-胶囊网络模型中; 利用损失函数计算所述VGG16-胶囊网络模型的输出值与所述训练集中的若干遥 感图像实际类别标签之间的损失值; 按照极小化误差的方法反向传播调整所述VGG16-胶囊网络模型的参数,对所述 VGG16-胶囊网络模型进行迭代优化; 若所述损失值不在降低或迭代次数达到设定值后,获得训练好的VGG16-胶囊网络 模型。 上述技术方案中,遥感图像实际类别标签采用独热编码表示为二进制向量。具体 操作过程为:将待分类的类别数映射为整数值,然后每个整数值被表示为二进制向量,向量 中索引值等于整数值的位置被标记为1,其他为0。 可选的,所述损失函数采用margin loss函数,表达式为: Lk=Tkmax(0,m -||vk||)2 λ(1-Tk)max(0,||vk||-m-)2; 其中,k表示类别,Tk表示类别的指示函数,若类别存在,则Tk=1,反之,Tk=0;m 表 示上margin,惩罚假阴性,m-表示下margin,惩罚假阳性,vk表示向量,||vk||表示向量的长 度,λ为比例系数。 上述技术方案中,所有向量损失的总和即为总损失值,通过反向传播更新VGG16- 胶囊网络模型中各个层的参数,从而使得总损失值减小。 可选的,所述DigitCaps层的输出为K个16维向量,每个向量vk的长度表示所述 VGG16-胶囊网络模型预测类别k的概率。 上述技术方案中,对于某张遥感图像的分类结果是VGG16-胶囊网络模型最后输出 的向量组中向量长度最大的类别,即为该张遥感图像的类别。 可选的,将所述原始遥感图像处理成像素一致的样本集的方法为: 对所述原始遥感图像的主要区域进行切割; 调整切割后的遥感图像大小; 得到像素一致的样本集。 本发明的一种基于胶囊网络的遥感图像分类方法相对于现有技术而言,具有以下 有益效果: (1)本发明采用VGG16网络模型和胶囊网络的混合网络模型,有效综合了VGG16网 络模型的高级特征提取能力和胶囊网络的空间信息捕捉能力,能够有效捕捉遥感图像的层 次结构,并且提取合适的高级特征,从而对遥感图像进行分类,分类效果更好。 (2)本发明利用VGG16的多层卷积提取复杂高级特征作为胶囊网络的输入,胶囊网 络中则使用向量表征某个物体的“实例”,利用复杂高级特征作为输入,可以让每个向量表 征某个物体的更高级的“实例”,向量的长度表征“实例”出现的概率,向量的方向表征该“实 例”的某些图形属性,如:位置、形状、方向、颜色等,其中物体的“实例”表示遥感图像的某一 部分。 (3)本发明才用的VGG16网络模型的结构简单,与胶囊网络的结合方式更加简单, 容易复现,在实际中具有一定的应用价值。 6 CN 111598140 A 说 明 书 4/7 页 附图说明 为了更清楚地说明本发明的技术方案,下面将对实施例中所需要使用的附图作简 单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还 可以根据这些附图获得其他的附图。 图1为本发明一种基于胶囊网络的遥感图像分类方法的步骤流程图; 图2为本发明一种基于胶囊网络的遥感图像分类方法的实施过程示意图; 图3为本发明的实施例中VGG16-胶囊网络模型的结构示意图。