
技术摘要:
一种移动物体的识别方法、装置、及存储介质,包括采集视频;检测所采集的视频中的移动物体的运动轨迹;确定所检测到的运动轨迹中,每个移动区域与该运动轨迹所包含的多个移动区域的中心位置之间的第一距离,根据多个所述第一距离得到所述运动轨迹的类内距离;对于类内 全部
背景技术:
随着人们生活水平的提高,卫生安全变得越来越重要,卫生安全中,食品安全是很 重要的一块。厨房卫生安全是食品安全的重要组成部分,而在厨房卫生安全中,老鼠带来的 危险是非常高的。但是一方面,我们难以时刻监视厨房中是否出现老鼠,另一方面,捕鼠器、 老鼠药是有效的除鼠手段,但是在没有看到老鼠的情况下,难以确定捕鼠器、老鼠药的放置 地点,除鼠的效率会低很多。所以,监视厨房是否出现老鼠,并在出现老鼠的时候地位老鼠 的移动轨迹就变得非常重要。本发明针对的是夜间视频,而且为了加大算法的可行性,每个 视频的长度一般为一分钟到两分钟。过长的视频需要被切分成短视频。短视频保证了视频 的整体背景变化很小。 现有技术中,一般采用的为基于深度学习的图片分类模型进行判断,对于一张图 片,如果图片中有老鼠,就判断整张图片的类别为老鼠。可是使用常用的图像分类模型,如 resnet,densenet等。但厨房视频图像中,老鼠只占图片的一个很小的区域。一方面,如果模 型要很好的识别图片中的老鼠,使用的深度学习模型需要很大,计算量和存储都会变大很 多。另一方面,如果模型效果要好的话,需要海量的数据,同时因为不同厨房背景差异大,即 使训练得到效果好的分类模型,也难以保证模型的泛化能力。此外,对整张图片做分类就没 法对老鼠定位了,也无法得到老鼠的移动轨迹图。 现有技术中,也会采用基于深度学习的目标检测模型,该模型能够有效的识别图 片中的目标,以及定位目标的位置。通过训练一个关于老鼠的深度学习目标检测模型,如 Faster-RCNN,SSD,YOLO-v3等可以有效的识别图片中的老鼠,达到检测视频中的老鼠的目 的。但是,一方面,对于同一个店铺的厨房,可以训练一个有效的目标检模型,但是这个模型 在其它的店铺很可能效果就很差了。一个目标检测模型,不仅需要判断图片中哪些是老鼠, 还需要判断哪些不是老鼠,不同的店铺中,店铺的背景差异很大,所以使用深度学习目标检 测模型效果并不好。如果希望训练一个泛化能力很好的目标检测模型,那么就需要很多很 多不同背景下的老鼠图片,而这很难达到。另一方面,目标检测模型计算量都比较大,这种 模型如果同时部署到很多店铺的话,需要的计算成本也很高。 现有技术中,还会混合高斯背景建模和基于深度学习的图片分类模型,主要包括 两个部分: a)混合高斯背景建模,在运动目标检测提取中,背景目标对于目标的识别和跟踪 至关重要。而混合高斯背景建模适合于在摄像机固定的情况下从图像序列中分离出背景和 前景。在摄像机固定的情况下,背景的变化是缓慢的,而且大都是光照,风等等的影响,通过 对背景建模,对一幅给定图像分离前景和背景,一般来说,前景就是运动物体,从而达到运 动物品检测的目的。 b)基于深度学习的图片分类模型,常用的图像分类网络,如resnet、VGG16、 4 CN 111582025 A 说 明 书 2/7 页 densenet等,可以通过对一张图片打上类别标记,然后训练一个分类模型,以此识别给定图 片的类别。基于移动检测得到的小区域图片做分类,需要的模型就会比较小,模型泛化能力 也会比直接使用分类模型好很多。 餐厅厨房场景下,摄像头是固定摄像头,背景变化也比较小,移动物品检测算法效 果会比较好。通过结合混合高斯背景建模的移动物品检测模型以及图像分类模型可以有效 的检测视频中的老鼠,并定位老鼠的位置。先检测视频中移动的物品所在的位置,然后使用 图片分类模型对图片做分类,判断该移动物品是不是老鼠,以此判断视频中是否出现老鼠, 以及老鼠的位置。 但是,上述深度学习分类模型受限于训练数据和模型效果,模型也难以达到完美 的效果。而在厨房中,会有冰箱,插排,各种电器的闪光,加上各种钢铁的反光,这些东西因 为移动检测算法的不完美,有时候会将这些光误检为移动物品,再加上有些光亮很像老鼠 的眼睛,所有也容易将这些物品误检为老鼠。 所以,为了训练一个泛化能力强,效果也很好,且不容易对视频中各种因为光亮变 化导致的误检。除了针对图片本身,还需要基于物体的移动轨迹来排除那些非老鼠的闪光 轨迹,正确判断移动物品是否是老鼠。
技术实现要素:
本申请提供了一种移动物体的识别方法、装置、及存储介质,能够达到较准确的识 别移动物体的目的。 本申请提供了一种移动物体的识别方法,包括:采集视频;检测所采集的视频中的 移动物体的运动轨迹;确定所检测到的运动轨迹中,每个移动区域与该运动轨迹所包含的 多个移动区域的中心位置之间的第一距离,根据多个所述第一距离得到所述运动轨迹的类 内距离;其中,移动区域是指所述视频包含的帧图片中,组成所述运动轨迹的矩形区域;对 于类内距离符合预定条件的运动轨迹,采用预先训练好的图片分类模型,对所述视频中该 运动轨迹对应的每一张图片进行识别,根据识别结果确定所述视频中是否包含指定物体。 与相关技术相比,本申请实施例通过确定运动轨迹的类内距离对移动物体的可能 情形进行识别,再采用图片分类模型进行进一步的确认,从而能够提高对应移动物体的识 别准确性。 在一个示例性实施例中,本申请实施例通过确定运动轨迹的类内距离对移动物体 的,对非指定物体的闪光轨迹进行排除,从而能够提高对应移动物体的识别准确性。 在一个示例性实施例中,本申请实施例通过图片分类模型对每帧帧图片的预测值 进行预定方式的处理,从而能够得到移动轨迹的预测结果。 本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书以及附图中 所描述的方案来实现和获得。 附图说明 附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的 实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。 5 CN 111582025 A 说 明 书 3/7 页 图1本申请实施例移动物体的识别方法流程图; 图2本申请实施例移动物体的识别装置模块示意图; 图3本申请实施例基于具体场景下的移动物体识别视频图片示意图; 图4本申请实施例基于具体场景下的光的折射图片; 图5本申请实施例基于具体场景下的光的闪光图片。