logo好方法网

图像识别模型的训练方法和装置


技术摘要:
本申请公开了一种图像识别模型的训练方法、图像识别方法、装置、设备以及存储介质,属于图像处理领域。通过本申请提供的技术方案,服务器可以采用参考样本图像、正样本图像以及尺寸小于正样本图像的负样本图像,来训练图像识别模型。服务器可以将负样本图像放大至与正  全部
背景技术:
随着计算机技术的发展,人工智能技术蓬勃发展,图像识别技术作为人工智能技 术的一个分支,其应用范围越来越广泛,例如图像识别技术可以应用在人脸识别场景,采用 图像识别模型对包含人脸的图像进行识别,可以得到与人脸对应的身份信息;或者应用在 医学场景,采用图像识别模型对医学影像进行识别,发现一些人眼无法识别的病变现象,从 而辅助医生确定治疗方案。 相关技术中为了训练得到识别精度较高的图像识别模型,往往需要大量有标注的 样本图像来对图像识别模型进行训练。由于对样本图像进行标注需要耗费大量的时间,采 用大量有标注的样本图像对图像识别模型进行训练并不现实。因此,相关技术在训练图像 识别模型时会对少量有标注的样本图像进行数据增强,但是数据增强后得到的样本图像的 与初始的样本图像差别不大,导致图像识别模型的训练效果不佳。
技术实现要素:
本申请实施例提供了一种图像识别模型的训练方法、图像识别方法、装置、服务器 及存储介质,可以提升图像识别模型的训练效果。所述技术方案如下: 一方面,提供了一种图像识别模型的训练方法,所述方法包括: 获取参考样本图像、正样本图像以及负样本图像,所述负样本图像的尺寸小于所 述正样本图像,所述参考样本图像、所述正样本图像以及所述负样本图像中均包括尺寸处 于目标范围内的样本对象; 将所述负样本图像的尺寸放大至与所述正样本图像相同; 将所述参考样本图像、所述正样本图像和放大后的负样本图像输入图像识别模 型,通过所述图像识别模型确定第一尺寸差异信息和第二尺寸差异信息,所述第一尺寸差 异信息用于表示所述参考样本图像和所述正样本图像中所述样本对象的尺寸差异,所述第 二尺寸信息用于表示所述参考样本图像和所述负样本图像中所述样本对象的尺寸差异; 响应于所述第一尺寸差异信息和所述第二尺寸差异信息之间的差值符合目标条 件,将所述图像识别模型作为训练完成的图像识别模型。 一方面,提供了一种图像识别方法,所述方法包括: 获取第一图像,所述第一图像中包括第一对象; 将所述第一图像输入图像识别模型,通过所述图像识别模型提取所述第一图像的 第一图像特征; 其中,所述图像识别模型基于多个参考图像和正样本图像以及尺寸小于所述正样 本图像的负样本图像训练得到;所述参考样本图像、所述正样本图像以及所述负样本图像 5 CN 111598025 A 说 明 书 2/28 页 中包括尺寸处于目标范围内的样本对象; 根据所述第一图像特征,输出所述样本对象在所述第一图像中的尺寸信息。 一方面,提供了一种图像识别模型的训练装置,所述装置包括: 样本图像获取模块,用于获取参考样本图像、正样本图像以及负样本图像,所述负 样本图像的尺寸小于所述正样本图像,所述参考样本图像、所述正样本图像以及所述负样 本图像中均包括尺寸处于目标范围内的样本对象; 放大模块,用于将所述负样本图像的尺寸放大至与所述正样本图像相同; 样本图像输入模块,用于将所述参考样本图像、所述正样本图像和放大后的负样 本图像输入图像识别模型,通过所述图像识别模型确定第一尺寸差异信息和第二尺寸差异 信息,所述第一尺寸差异信息用于表示所述参考样本图像和所述正样本图像中所述样本对 象的尺寸差异,所述第二尺寸信息用于表示所述参考样本图像和所述负样本图像中所述样 本对象的尺寸差异; 模型确定模块,用于响应于所述第一尺寸差异信息和所述第二尺寸差异信息之间 的差值符合目标条件,将所述图像识别模型作为训练完成的图像识别模型。 在一种可能的实施方式中,所述样本图像获取模块包括: 原始图像获取子模块,用于获取原始图像,所述原始图像的尺寸大于所述正样本 图像或所述参考样本图像中的任一个图像,所述原始图像包括至少两个所述样本对象; 参考和正样本图像获取子模块,用于从所述原始图像中获取所述参考样本图像和 所述正样本图像; 负样本图像获取子模块,用于从所述正样本图像中获取所述负样本图像。 在一种可能的实施方式中,所述参考样本图像和所述正样本图像包括至少一个不 同的样本对象; 所述原始图像获取子模块用于从所述原始图像中的不同位置获取所述参考样本 图像和所述正样本图像。 在一种可能的实施方式中,所述负样本图像的尺寸根据采样池中至少两个目标尺 寸随机确定。 在一种可能的实施方式中,所述装置还包括: 特征信息提取模块,用于通过所述图像识别模型,提取所述原始图像的原始图像 特征信息; 生成模块,用于根据所述原始图像特征信息,生成参考原始图像; 第一调整模块,用于根据所述原始图像特征信息和所述参考原始图像的图像特征 信息,调整所述图像识别模型的模型参数。 在一种可能的实施方式中,所述参考样本图像和所述正样本图像的尺寸相同。 在一种可能的实施方式中,所述通样本图像输入模块用于通过所述图像识别模 型,提取所述参考样本图像的参考特征信息、所述正样本图像的正样本特征信息以及所述 负样本图像的负样本特征信息;根据所述参考特征信息和所述正样本特征信息,得到所述 第一尺寸差异信息;根据所述参考特征信息和所述负样本特征信息,得到所述第二尺寸差 异信息。 在一种可能的实施方式中,所述装置还包括: 6 CN 111598025 A 说 明 书 3/28 页 数量信息确定模块,用于确定所述正样本图像中样本对象的第一数量信息; 所述数量信息确定模块还用于确定所述放大后的负样本图像中样本对象的第二 数量信息; 第二调整模块,用于根据所述第一数量信息和第二数量信息之间的差异信息,调 整所述图像识别模型的模型参数。 在一种可能的实施方式中,所述数量信息确定模块用于通过所述图像识别模型, 提取所述正样本图像的正样本特征信息以及所述负样本图像的负样本特征信息;通过目标 函数,将所述正样本特征信息映射为所述正样本图像中样本对象的第一数量信息,所述目 标函数为单调函数;通过所述目标函数,将所述负样本特征信息映射为所述负样本图像中 样本对象的第二数量信息。 一方面,提供了一种图像识别装置,所述装置包括: 第一图像获取模块,用于获取第一图像,所述第一图像中包括第一对象; 第一图像输入模块,用于将所述第一图像输入图像识别模型,通过所述图像识别 模型提取所述第一图像的第一图像特征; 其中,所述图像识别模型基于多个参考图像和正样本图像以及尺寸小于所述正样 本图像的负样本图像训练得到;所述参考样本图像、所述正样本图像以及所述负样本图像 中包括尺寸处于目标范围内的样本对象; 输出模块,用于根据所述第一图像特征,输出所述样本对象在所述第一图像中的 尺寸信息。 在一种可能的实施方式中,所述输出模块还用于根据所述第一图像特征,输出所 述样本对象在所述第一图像中的数量信息。 一方面,提供了一种计算机设备,所述计算机设备包括一个或多个处理器和一个 或多个存储器,所述一个或多个存储器中存储有至少一条指令,所述指令由所述一个或多 个处理器加载并执行以实现所述图像识别模型的训练方法或图像识别方法所执行的操作。 一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至 少一条指令,所述指令由处理器加载并执行以实现所述图像识别模型的训练方法或图像识 别方法所执行的操作。 通过本申请提供的技术方案,服务器可以采用三个图像来训练图像识别模型,尺 寸相同的参考样本图像和正样本图像,尺寸小于正样本图像的负样本图像,三个图像中均 包括样本对象,三个图像中样本对象的尺寸相近。服务器可以获取上述三种图像,将负样本 图像放大至与正样本图像相同,这样会导致放大后的负样本图像中样本对象的尺寸大于其 他两个图像,也即是生成了一种有标注的样本图像,即负样本图像中样本对象的尺寸天然 比参考样本图像和正样本图像中的样本对象的尺寸大。将参考样本图像、正样本图像以及 放大后的负样本图像输入图像识别模型,通过图像识别模型确定样本对象在参考样本图像 和正样本图像中的第一尺寸差异信息以及样本对象在参考样本图像和负样本图像中的第 二尺寸差异信息,训练的目的也就是第一尺寸差异信息和第二差异信息之间的差值够大, 表明模型可以识别出样本对象的大小,也即是样本对象的尺寸信息,为后续的模型训练提 供先验知识,提高图像识别模型的训练效果。 7 CN 111598025 A 说 明 书 4/28 页 附图说明 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1是本申请实施例提供的一种图像识别模型的训练方法的实施环境的示意图; 图2是本申请实施例提供的一种图像识别模型的结构示意图; 图3是本申请实施例提供的一种图像识别模型的训练方法流程图; 图4是本申请实施例提供的一种图像识别模型的训练方法流程图; 图5是本申请实施例提供的一种从原始图像中获取参考样本图像和正样本图像, 以及从正样本图像中获取负样本图像的示意图; 图6是本申请实施例提供的一种图像识别模型的训练方法示意图; 图7是本申请实施例提供的一种图像识别模型的训练方法示意图; 图8是本申请实施例提供的一种图像识别模型的训练方法示意图; 图9是本申请实施例提供的一种从正样本图像中获取负样本图像的示意图; 图10是本申请实施例提供的一种图像识别模型的训练方法流程图; 图11是本申请实施例提供的一种图像识别模型的训练方法示意图; 图12是本申请实施例提供的一种图像识别模型的训练方法示意图; 图13是本申请实施例提供的一种图像识别模型的训练方法示意图; 图14是本申请实施例提供的一种图像识别模型的训练方法示意图; 图15是本申请实施例提供的一种U-Net网络结构示意图; 图16是本申请实施例提供的一种图像识别模型的训练方法流程图; 图17是本申请实施例提供的一种图像识别方法流程图; 图18是本申请实施例提供的MoNuSeg  2018数据集中的一些图片示例; 图19是本申请实施例提供的一种图像识别模型的训练装置结构的示意图; 图20是本申请实施例提供的一种图像识别装置结构的示意图; 图21是本申请实施例提供的一种终端的结构示意图; 图22是本申请实施例提供的一种服务器的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏