
技术摘要:
本发明涉及图像识别技术领域,尤其涉及图像分割方法及装置,所述方法包括:获取待分割的目标图像;分别对所述目标图像进行语义分割和物体分割,对应获得语义分割结果和物体分割结果;过滤掉所述物体分割结果中的第一类物体分割结果,保留所述物体分割结果中的第二类物 全部
背景技术:
图像识别是指利用计算机对图像进行处理、分析和理解,以识别出图像中的各个 对象的技术。图像识别的过程往往包含图像分割,图像分割是把图像分成若干个特定的、具 有独特性质的区域并提出感兴趣目标的技术和过程。随着智能手机、物联网和自动驾驶等 技术的不断发展,对图像分析的精度提出了更高的要求。早期的图像识别技术包括以下两 种:第一种是语义分割,语义分割是为图像中的每个像素都分配一个类标签,例如,一幅图 中有person、cat和dog三个类,那么语义分割的结果是在图中标识出person、cat和dog这三 个类别;第二种是物体分割,物体分割是检测和分割图像中的每个目标实例,例如,标识出 person1、person2、cat1、cat2、dog1和dog2。而随着技术的不断发展,更多的应用场景,如自 动驾驶、行车记录仪或直播等,需要进行全景分割,即同时完成语义分割和物体分割的过 程,而由于语义分割和物体分割是两个相互独立的过程,语义分割和物体分割的分割结果 往往存在矛盾,无法直接进行融合,从而导致图像识别的精确度降低。
技术实现要素:
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上 述问题的图像分割方法及装置。 依据本发明的第一个方面,本发明提供一种图像分割方法,所述方法包括: 获取待分割的目标图像; 分别对所述目标图像进行语义分割和物体分割,对应获得语义分割结果和物体分 割结果; 过滤掉所述物体分割结果中的第一类物体分割结果,保留所述物体分割结果中的 第二类物体分割结果,其中,所述第一类物体分割结果为分数低于预设分数阈值的物体分 割结果,所述第二类物体分割结果为分数等于和高于所述预设分数阈值的物体分割结果; 对所述第二类物体分割结果进行非极大值抑制处理; 将所述语义分割结果和经过非极大值抑制处理的所述第二类物体分割结果进行 融合,输出与所述目标图像对应的全景分割结果。 优选的,所述对所述第二类物体分割结果进行非极大值抑制处理,包括: 分别对每个混淆类别标签所对应的第二类物体分割结果进行非极大值抑制处理, 以及对除所述混淆类别标签以外的其他类别标签所对应的第二类物体分割结果进行非极 大值抑制处理。 优选的,在所述分别对每个混淆类别标签所对应的第二类物体分割结果进行非极 大值抑制处理,以及对除所述混淆类别标签以外的其他类别标签所对应的第二类物体分割 结果进行非极大值抑制处理之前,所述方法还包括: 4 CN 111598912 A 说 明 书 2/11 页 通过对类别标签训练集合中各个类别标签进行统计,确定所述混淆类别标签。 优选的,所述将所述语义分割结果和经过非极大值抑制处理的所述第二类物体分 割结果进行融合,包括: 基于所述语义分割结果和经过非极大值抑制处理的所述第二类物体分割结果,对 所述目标图像中的每个像素而言,选取分数最大的结果作为该像素的目标分割结果。 优选的,对所述目标图像进行语义分割,获得所述语义分割结果,包括: 基于语义分割模型,为所述目标图像中的每个像素添加一类别标签,并获得每个 像素归属于所述类别标签的分数。 优选的,对所述目标图像进行物体分割,获得所述物体分割结果,包括: 从所述目标图像中分离出各个物体对象; 为每个物体对象添加一类别标签,并获得每个物体对象归属于所述类别标签的分 数。 依据本发明的第二个方面,本发明提供一种图像分割装置,所述装置包括: 获取模块,用于获取待分割的目标图像; 分割模块,用于分别对所述目标图像进行语义分割和物体分割,对应获得语义分 割结果和物体分割结果; 过滤模块,用于过滤掉所述物体分割结果中的第一类物体分割结果,保留所述物 体分割结果中的第二类物体分割结果,其中,所述第一类物体分割结果为分数低于预设分 数阈值的物体分割结果,所述第二类物体分割结果为分数等于和高于所述预设分数阈值的 物体分割结果; 非极大值抑制处理模块,用于对所述第二类物体分割结果进行非极大值抑制处 理; 融合模块,用于将所述语义分割结果和经过非极大值抑制处理的所述第二类物体 分割结果进行融合,输出与所述目标图像对应的全景分割结果。 优选的,所述非极大值抑制处理模块,包括: 非极大值抑制处理单元,用于分别对每个混淆类别标签所对应的第二类物体分割 结果进行非极大值抑制处理,以及对除所述混淆类别标签以外的其他类别标签所对应的第 二类物体分割结果进行非极大值抑制处理。 优选的,所述装置还包括: 统计模块,用于通过对类别标签训练集合中各个类别标签进行统计,确定所述混 淆类别标签。 优选的,所述融合模块包括: 融合单元,用于基于所述语义分割结果和经过非极大值抑制处理的所述第二类物 体分割结果,对所述目标图像中的每个像素而言,选取分数最大的结果作为该像素的目标 分割结果。 优选的,所述分割模块,包括: 语义分割单元,用于基于语义分割模型,为所述目标图像中的每个像素添加一类 别标签,并获得每个像素归属于所述类别标签的分数。 优选的,所述分割模块,包括:物体分割单元; 5 CN 111598912 A 说 明 书 3/11 页 所述物体分割单元包括: 分割子单元,用于从所述目标图像中分离出各个物体对象; 添加子单元,用于为每个物体对象添加一类别标签,并获得每个物体对象归属于 所述类别标签的分数。 依据本发明的第三个方面,提供了一种计算机可读存储介质,其上存储有计算机 程序,该程序被处理器执行时实现如前述第一个方面中的方法步骤。 依据本发明的第四个方面,提供了一种计算机设备,包括存储器、处理器及存储在 存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如前述第一 个方面中的方法步骤。 根据本发明的图像分割方法及装置,在获取待分割的目标图像之后,先分别对所 述目标图像进行语义分割和物体分割,对应获得语义分割结果和物体分割结果,接着过滤 掉所述物体分割结果中的第一类物体分割结果,保留所述物体分割结果中的第二类物体分 割结果,其中,所述第一类物体分割结果为分数低于预设分数阈值的物体分割结果,所述第 二类物体分割结果为分数等于和高于所述预设分数阈值的物体分割结果,然后对所述第二 类物体分割结果进行非极大值抑制处理,最后将所述语义分割结果和经过非极大值抑制处 理的所述第二类物体分割结果进行融合,输出与所述目标图像对应的全景分割结果,由于 对物体分割结果进行了过滤,并在过滤后进行非极大值抑制处理,进而使得语义分割结果 和物体分割结果能够有效地融合,避免出现矛盾的情况,提高了图像识别的精确度。 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的