logo好方法网

评估目标检测模型的方法和系统


技术摘要:
本发明提供一种评估目标检测模型的方法和系统。该方法包括:基于目标检测模型,生成表示目标的预测边界框。该目标位于一个或多个相邻目标附近。该方法还包括确定该预测边界框和该目标的真值边界框之间的交集面积,以及确定该预测边界框和该目标的真值边界框之间的修正  全部
背景技术:
光学字符识别(Optical  Character  Recognition,OCR)将打印、手写或印刷的文 本图像机械地或电子地转换为机器编码文本,无论该文本图像是来自扫描文档、文档照片、 场景照片或叠加在图像上的字幕文本等等。为了识别文本,第一步要检测各文本段的边界 框。用于检测文本的算法属于计算机视觉中的“目标检测”的领域。 在目标检测中,交并比(Intersection  over  Union,IoU)是用于评估检测器和模 型选择的准确性的通用标准度量。传统的Io U公式定义为“预测边界框与真值 (groundtruth)边界框之间的交集面积除以预测边界框与真值边界框之间的并集面积”。在 大多数情况下,此公式都适用。但是,在文本检测的情况下,传统的IoU可能无法选择最佳的 模型/参数,因此使用传统的IoU可能会大大降低文本识别的最终准确性。 例如,传统的IoU公式没有考虑至少两种情况,即,(1)传统的IoU没有考虑到交集 (intersection)较小以及并集(union)较大均会类似地导致IoU较小,但是,对于文本检测 而言,交集较小比并集较大更糟糕,因为这可能会导致文本的某些区域丢失并影响随后的 OCR结果;(2)传统的IoU不考虑预测文本框与其他真值文本框之间的交集。如果缺乏对以上 两种情况的考虑,即使IoU值更高,模型却不一定更好。 因此,需要提供可以改善用于文本检测的目标检测模型的评估的方法和设备。
技术实现要素:
本公开的第一方面提供了一种用于评估目标检测模型的性能的方法。该方法包括 基于所述目标检测模型,生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻 目标附近;确定所述预测边界框和所述目标的真值边界框之间的交集面积;确定所述预测 边界框和所述目标的真值边界框之间的修正并集面积。确定所述修正并集面积包括根据一 个或多个权重,确定所述预测边界框和所述真值边界框之间的加权并集面积;以及将所述 预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积加上所述 加权并集面积。该方法还包括确定分数,该分数等于所述预测边界框和所述目标的真值边 界框之间的交集面积除以所述修正并集面积。该分数代表目标检测模型的性能。 本公开的第二方面提供一种目标检测方法。该方法包括:接收未标记的实际数据 和多个目标检测模型,其中,所述多个目标检测模型由神经网络基于标记的训练数据生成; 使用第一方面所述的方法,利用验证数据评估每个所述目标检测模型,以识别具有最高分 数的所述目标检测模型;以及根据识别出的所述目标检测模型,在所述未标记的实际数据 中检测目标。 本公开的第三方面提供一种用于评估目标检测模型的系统。该系统包括处理器以 5 CN 111723809 A 说 明 书 2/8 页 及耦合到所述处理器并且存储有指令的计算机可读存储器。所述指令可由处理器执行以基 于所述目标检测模型,生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻目 标附近;确定所述预测边界框和所述目标的真值边界框之间的交集面积;并确定所述预测 边界框和所述目标的所述真值边界框之间的修正并集面积。所述并集修正面积是以下的总 和:所述预测边界框和所述真值边界框之间的基于一个或多个权重的加权并集面积;以及 所述预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的交集面积。指令 还可以由所述处理器执行以确定等于所述预测边界框和所述目标的真值边界框之间的交 集面积除以所述修正并集面积的分数。该分数代表目标检测模型的性能。 本公开的第四方面提供一种装置,包括:目标检测模块,其被配置为基于目标检测 模型生成表示目标的预测边界框,其中,所述目标位于一个或多个相邻目标附近;以及评估 模块。评估模块被配置为确定所述预测边界框和所述目标的真值边界框之间的交集面积; 并确定所述预测边界框和所述目标的所述真值边界框之间的修正并集面积。所述修正并集 面积是以下的总和:所述预测边界框和所述真值边界框之间的基于一个或多个权重的加权 并集面积;以及所述预测边界框与所述一个或多个相邻目标的至少一个真值边界框之间的 交集面积。评估模块还被配置为确定分数,该分数等于所述预测边界框和所述目标的真值 边界框之间的交集面积除以所述修正并集面积;并基于所述分数,评估所述目标检测模型 的性能。 本公开的第五方面提供了一种目标检测器。目标检测器包括接收器模块,其被配 置为接收未标记的实际数据和多个目标检测模型。所述多个目标检测模型由神经网络基于 标记的训练数据生成。目标检测器还包括如第四方面中限定的装置,该装置被耦合到所述 接收器模块,并且被配置为利用验证数据评估每个所述目标检测模型,以识别具有最高分 数的所述目标检测模型。目标检测模块还被配置为根据识别出的所述目标检测模型,在所 述未标记的实际数据中检测目标。 附图说明 通过以下仅作为示例的文字描述,并结合附图,本领域的普通技术人员将更好地 理解、更加清楚本发明的实施例,其中: 图1为根据一实施例示出的用于评估目标检测模型的方法的流程图。 图2a和图2b示出了在图1的方法中确定修正并集面积的实施方式的示意图。 图3为根据一实施例示出的目标检测方法的流程图。 图4为根据一实施例示出的目标检测器的示意图。 图5示出了适合于实现图1和图3的方法以及图4的目标检测器的计算机系统的示 意图。 技术人员将理解,图中的要素是为了简单和清楚而示出的,并不一定按比例绘制。 例如,相对于其他要素,可以放大插图、框图或流程图中的一些要素的尺寸,以帮助提高对 本实施例的理解。
分享到:
收藏