
技术摘要:
本发明公开了一种基于深度学习的训练数据平衡方法、设备和系统,属于图像识别技术领域。本发明通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例,与训练数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,调整训练数据中目标 全部
背景技术:
近年来,随着深度学习技术和目标检测的发展,为了提高深度学习和目标检测的 效果,需要对训练数据进行平衡,从而提高深度学习和目标检测的可靠性。 现有技术提供了一种一种训练数据平衡方法,包括:首先取出数据集中多数类和 少数类样本集合并计数,对多少样本类进行聚类和对少数类样本进行过采样,然后对多数 和少数类样本集合进行相组合,并抽取其特征加入到类别平衡的新数据集中,然后对新特 征进行训练。 但是现有技术存在如下问题: 在对训练数据平衡过程中,并未避免由少量样本类中的锚框个数不平衡所导致的可靠 性降低的问题。
技术实现要素:
为了解决现有技术的问题,本发明提供了一种基于深度学习的训练数据平衡方 法、设备和系统,包括: 一方面,提供了一种基于深度学习的训练数据平衡方法,所述方法包括: 获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例; 获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二 尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数 量比例; 根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框 值最大的图片以及框值最小的图片; 根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。 可选的,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中 所述目标类别的框值最大的图片以及框值最小的图片之前,所述方法还包括: 若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无 需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片,否则,则调 整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。 可选的,所述根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中 所述目标类别的框值最大的图片以及框值最小的图片包括: 若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除 所述框值最大的图片; 若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加 4 CN 111598185 A 说 明 书 2/11 页 所述框值最小的图片。 可选的,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片 数量之前,所述方法还包括: 若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数 量阈值,则无需调整所述训练数据中所述目标类别的图片数量,否则,则调整所述训练数据 中所述目标类别的图片数量。 可选的,所述根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片 数量包括: 所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数 量阈值,则减少所述目标类别的图片数量; 所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数 量阈值,则增加所述目标类别的图片数量。 可选的,所述方法还包括: 根据调整后的训练数据进行训练,获取训练结果; 若所述训练结果不符合预期,则继续执行所述获取所述第一尺寸比例以及所述锚框数 量比例的步骤。 另一方面,提供了一种基于深度学习的训练数据平衡设备,所述设备包括: 获取模块,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸 比例; 所述获取模块还用于获取训练数据中所俗话目标类别的图像尺寸所占所述所有待调 整类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整 类别的锚框总数量的锚框数量比例; 调整模块,用于根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所 述目标类别的框值最大的图片以及框值最小的图片; 所述调整模块还用于根据所述锚框数量比例,调整所述训练数据中所述目标类别的图 片数量。 可选的,所述调整模块具体用于: 若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无 需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片; 若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除 所述框值最大的图片; 若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加 所述框值最小的图片。 可选的,所述调整模块还具体用于: 若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数 量阈值,则无需调整所述训练数据中所述目标类别的图片数量; 所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数 量阈值,则减少所述目标类别的图片数量; 所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数 5 CN 111598185 A 说 明 书 3/11 页 量阈值,则增加所述目标类别的图片数量。 可选的,所述设备还包括: 训练模块,所述训练模块具体用于根据调整后的训练数据进行训练,获取训练结果; 若所述训练结果不符合预期,则所述获取模块继续执行所述获取所述第一尺寸比例以 及所述锚框数量比例的步骤。 另一方面,提供了一种基于深度学习的训练数据平衡设备,所述设备包括处理器 以及与所述处理器连接的存储器,所述存储器用于存储一组程序代码,所述处理器执行所 述存储器所存储的程序代码用于执行以下操作: 获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例; 获取训练数据中所述目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二 尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类别的锚框总数量的锚框数 量比例; 根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所述目标类别的框 值最大的图片以及框值最小的图片; 根据所述锚框数量比例,调整所述训练数据中所述目标类别的图片数量。 可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作: 若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无 需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片,否则,则调 整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片。 可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作: 若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除 所述框值最大的图片; 若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加 所述框值最小的图片。 可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作: 若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数 量阈值,则无需调整所述训练数据中所述目标类别的图片数量,否则,则调整所述训练数据 中所述目标类别的图片数量。 可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作: 所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数 量阈值,则减少所述目标类别的图片数量; 所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数 量阈值,则增加所述目标类别的图片数量。 可选的,所述处理器执行所述存储器所存储的程序代码还用于执行以下操作: 根据调整后的训练数据进行训练,获取训练结果; 若所述训练结果不符合预期,则继续执行所述获取所述第一尺寸比例以及所述锚框数 量比例的步骤。 另一方面,提供了一种基于深度学习的训练数据平衡系统,所述系统包括: 获取设备,用于获取测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸 6 CN 111598185 A 说 明 书 4/11 页 比例; 所述获取设备还用于获取训练数据中所述目标类别的图像尺寸所占所述所有待调整 类别的图像总尺寸的第二尺寸比例,以及所述目标类别的锚框数量所占所述所有待调整类 别的锚框总数量的锚框数量比例; 调整设备,用于根据所述第一尺寸比例和所述第二尺寸比例,调整所述训练数据中所 述目标类别的框值最大的图片以及框值最小的图片; 所述调整设备还用于根据所述锚框数量比例,调整所述训练数据中所述目标类别的图 片数量。 可选的,所述调整设备具体用于: 若所述第一尺寸比例和所述第二尺寸比例之间的差值绝对值小于尺寸比例阈值,则无 需调整所述训练数据中所述目标类别的框值最大的图片以及框值最小的图片; 若所述第一尺寸比例和所述第二尺寸比例之间的差值大于所述尺寸比例阈值,则删除 所述框值最大的图片; 若所述第二尺寸比例和所述第一尺寸比例之间的差值大于所述尺寸比例阈值,则增加 所述框值最小的图片。 可选的,所述调整设备还具体用于: 若所述锚框数量比例与其他目标类别的锚框数量比例之间的差值绝对值小于锚框数 量阈值,则无需调整所述训练数据中所述目标类别的图片数量; 所述锚框数量比例与所述其他目标类别的锚框数量比例之间的差值大于所述锚框数 量阈值,则减少所述目标类别的图片数量; 所述其他目标类别的锚框数量比例与所述锚框数量比例之间的差值大于所述锚框数 量阈值,则增加所述目标类别的图片数量。 可选的,所述系统还包括: 训练设备,所述训练模块具体用于根据调整后的训练数据进行训练,获取训练结果; 若所述训练结果不符合预期,则所述获取模块继续执行所述获取所述第一尺寸比例以 及所述锚框数量比例的步骤。 本发明提供了一种基于深度学习的训练数据平衡方法、设备和系统,包括:获取测 试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例;获取训练数据中目标 类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,以及目标类别的锚框 数量所占所有待调整类别的锚框总数量的锚框数量比例;根据第一尺寸比例和第二尺寸比 例,调整训练数据中目标类别的框值最大的图片以及框值最小的图片;根据锚框数量比例, 调整训练数据中目标类别的图片数量。 本发明提供的技术方案所达到的有益效果是: 1、通过测试数据中目标类别的图像尺寸所占所有图像总尺寸的第一尺寸比例,与训练 数据中目标类别的图像尺寸所占所有待调整类别的图像总尺寸的第二尺寸比例,调整训练 数据中目标类别的框值最大的图片以及框值最小的图片,避免了少量样本类中的锚框个数 不平衡所导致的可靠性降低; 2、通过训练数据中目标类别的锚框数量所占所有待调整类别的锚框总数量的锚框数 量比例,调整训练数据中目标类别的图片数量,避免了少量样本类中的锚框个数不平衡所 7 CN 111598185 A 说 明 书 5/11 页 导致的可靠性降低。 附图说明 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使 用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于 本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他 的附图。 图1是本发明实施例提供的一种基于深度学习的训练数据平衡方法流程图; 图2是本发明实施例提供的一种基于深度学习的训练数据平衡方法流程图; 图3是本发明实施例提供的一种基于深度学习的训练数据平衡设备结构示意图; 图4是本发明实施例提供的一种基于深度学习的训练数据平衡设备结构示意图; 图5是本发明实施例提供的一种基于深度学习的训练数据平衡系统示意图。