
技术摘要:
本发明特别涉及一种单模态图像哈希检索方法。该单模态图像哈希检索方法,包括图像预处理,图像特征提取,输出注意力图像和生成哈希检索模型四部分。该单模态图像哈希检索方法,通过attention机制提取图片模态中的语义信息,提高了哈希检索模型生成哈希函数的质量,同时 全部
背景技术:
随着科技进步,互联网技术飞速发展,技术更新日新月异,图像视频数据出现大爆 炸式的增长。常规的图像检索技术包括基于文本的图像检索技术(Text-based Image Retrieval,简称TBIR)和基于内容的图像检索(Content-based Image Retrieval,简称 CBIR) 技术两种检索方式。其中,基于文本的图像检索技术是利用文本描述的方式描述图 像的特征,如绘画作品的作者、年代、流派、尺寸等;基于内容的图像检索技术是对图像的内 容语义,如图像的颜色、纹理、布局等进行分析和检索的图像检索技术。目前,基于内容的图 像检索技术成为主流的图像检索方法。 图像哈希检索技术旨在将已有数据集合进行搜索,找出符合要求的图像数据。由 于哈希码具有存储数据小,检索速度快的优点,所以哈希检索被广泛应用在检索任务中。现 有的图像哈希检索技术可以分为深度模型检索技术和非深度模型检索技术两类。传统做法 一般是采用深度网络,提取图像特征,并根据提取到的特征使用全连接网络在交叉熵损失 将样本转化成哈希码保存在数据库中。 由于在现实环境中,一个图像中包含非常多丰富信息,往往存在多个类被信息,对 于传统的针对一个类信息往往精确度不够,图像中的背景中的冗余信息和值得重点关注区 域的信息在哈希学习过程中居于同样的地位。而现有的大多哈希检索模型旺旺只关注图像 中值得重点关注区域的信息,不能充分利用全部图像信息。 基于上述问题,本发明提出了一种单模态图像哈希检索方法。
技术实现要素:
本发明为了弥补现有技术的缺陷,提供了一种简单高效的单模态图像哈希检索方 法。 本发明是通过如下技术方案实现的: 一种单模态图像哈希检索方法,其特征在于:包括图像预处理,图像特征提取,输 出注意力图像和生成哈希检索模型四部分; 首先通过定义多级语义相似关系矩阵来保持多标签数据中丰富的语义信息,同时 采用Attention机制自发寻找图像中的重点关注区域,通过学习生成与图像表示大小相同 的掩码,从而提取图片模态中的语义信息,辅助哈希检索模型得到更高质量的哈希函数。 本发明单模态图像哈希检索方法,具体实施步骤如下: 第一步,获取训练集原始图片,将图像分别对应不同残差网络进行输入; 第二步,将训练样本输入哈希检索模型,通过最小化损失函数优化哈希检索模型 参数; 第三步,固定模型,将所有样本通过哈希检索模型得到对应的哈希码,存入输入库 4 CN 111737507 A 说 明 书 2/4 页 以备使用; 第四步,使用哈希检索模型进行检索任务时,只需要将图片任意模态样本输入模 型生成该模态对应哈希码,然后在另一模态的哈希码数据库中寻找海明距离最近的N个(按 需求自定义)哈希码,返回与之对应的样本即可。 所述第二步中,采用迭代优化的方法优化模型参数,即固定一个参数,优化另外的 参数。 所述第二步中,优化哈希检索模型,包括以下步骤: (1)生成具有多级语义的相似性矩阵S; (2)提取图片模态的特征,得到图像模态特征Pi,并对图像进行分类任务,输出注 意力图像; (3)将得到的特征图像与注意力图像进行点乘,得到图片模态的特征表示Fi和文 本模态的特征表示Fj; (4)采用损失函数对哈希检索模型进行迭代优化,最终得到优化的哈希检索模型。 所述步骤(1)中,具有多级语义的相似性矩阵S表示为: 其中,|Ci|和|Cj|分别表示样本i和样本j所具有的类别数,D(i,j)表示两个样本所 共有的类别数;样本i和样本j组成的的相似性矩阵Sij∈[0,1],从而保证生成的S矩阵具有 更大的区分性。 所述步骤(2)中,采用Resnet101网络进行提取,并得到图像模态特征Pi;同时采用 Resnet01网络,去掉全连接层,加入平均池化层,输出为样本类别数据,对图像进行分类任 务,最后一层加入Attention机制,输出为注意力图像,激活重点关注的区域。 所述步骤(3)中,将的得到的特征图像与注意力图像进行点乘,并将得到的结果作 为输入进入全连接层得到图片模态的特征表示Fi;将文本模态的BOW(Bag of words)表示 输入到全连接层得到文本模态的特征表示Fj。 所述步骤(4)中,损失函数表示为: 其中,Sij为样本i和样本j组成的的相似性矩阵,σ为超参数,用来平衡惩罚项和数 据损失项,FTi为图片模态的特征表示的转置,Fj为文本模态的特征表示,L2为常见的量化损 失,L3为位平衡损失。 本发明的有益效果是:该单模态图像哈希检索方法,通过attention机制提取图片 模态中的语义信息,提高了哈希检索模型生成哈希函数的质量,同时通过使用多级语义监 督方式,增强了拥有多个标签数据间检索的精度,使得最为匹配的项位于最终检索结果的 前面,从而极大的提高了检索效率。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 5 CN 111737507 A 说 明 书 3/4 页 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明 的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 这些附图获得其他的附图。 附图1为本发明单模态图像哈希检索方法示意图。