logo好方法网

基于深度学习的人脸数据集标注方法、系统、终端及介质


技术摘要:
本发明提供的基于深度学习的人脸数据集标注方法、系统、终端及介质,方法包括以下步骤:获取包含多个图片的待标注人脸数据集;构建并训练人脸检测模型,保存训练好的人脸检测模型;利用训练好的人脸检测模型对待标注人脸数据集中图片的人脸进行检测,得到各个图片中人  全部
背景技术:
人脸识别技术是基于人的脸部特征信息来进行身份识别的一种生物识别技术。而 现有人脸识别技术需要利用人脸数据集对人脸识别模型进行训练,再利用训练好的人脸识 别模型进行人脸匹配。其中人脸数据集需要在人脸图像中标注出人脸的位置以及身份。 现有的人脸数据集的标注通常依赖于人工标注,需要耗费大量人力,且标注的效 率很低,无法满足模型训练需要大量已标注数据集的要求。为了解决上述问题,目前已经有 一些通过传统机器学习方法或者第三方服务来辅助标注的方法,例如: 申请号201410053879.6中提到的一种人脸图像的身份标注方法及人脸身份识别 方法。该方法利用搜索引擎搜索待标注图像的网页,然后根据网页中所出现人名的频率和 第三方API来确定该图片的身份。具体的流程如图1所示。但是该方法过于相信搜索引擎,搜 索引擎返回的结果有可能是和待标注样本相关的网页,很多时候并不是待标注样本中的人 物。而且该发明依赖于第三方API,没有给出自已的人脸识别方案。 申请号201310268319.8中提到的人脸标注方法、装置及设备中通过聚类的方式来 对待标注人脸数据集进修聚类。具体步骤如下:1、获取人脸数据库中任意两个人脸之间的 人脸距离;2、根据待聚类人脸与其他人脸之间的人脸距离获取待聚类人脸的近邻人脸;3、 计算待聚类人脸和近邻人脸之间的复合共享近邻得分;4、根据该人脸距离以及复合共享近 邻得分对待聚类人脸进行聚类,得到包含有人脸的分类;5、标注分类中尚未标注的人脸。具 体的流程如图2所示。首先聚类方法不太适合类别太多的数据集。如果有几十万上百万的人 脸,聚类模型花费时间长、且很难收敛。并且聚类时需要提前告知有多少个类别,而且如果 数据集中单张图片包含多张人脸,在该场景下,聚类是行不通的。
技术实现要素:
针对现有技术中的缺陷,本发明提供一种基于深度学习的人脸数据集标注方法、 系统、终端及介质,极大地提高人脸数据集的标注效率,能够为人脸检测或人脸识别模型的 训练提供大量准确的样本。 第一方面,一种基于深度学习的人脸数据集标注方法,包括以下步骤: 获取包含多个图片的待标注人脸数据集; 构建并训练人脸检测模型,保存训练好的人脸检测模型; 利用训练好的人脸检测模型对待标注人脸数据集中图片的人脸进行检测,得到各 个图片中人脸位置,以获得样本; 接收用户针对样本中每个图片在人脸位置录入的人脸名字,完成待标注人脸数据 集中图片的标注。 4 CN 111597936 A 说 明 书 2/8 页 优选地,所述获取包含多个图片的待标注人脸数据集具体包括: 接收用户根据待标注人物录入的关键字; 根据所述关键词在预设的数据库进行搜索,获得与待标注人物匹配的资讯; 提取所述资讯中的图片; 根据提取到的所有图片构建所述待标注人脸数据集; 存储该待标注人脸数据集。 优选地,所述人脸检测模型为SSH模型;其中SSH模型的主干网为VGG16。 优选地,所述利用训练好的人脸检测模型对待标注人脸数据集中图片的人脸进行 检测,得到各个图片中人脸位置具体包括: 加载训练好的人脸检测模型和待标注人脸数据集; 利用训练好的人脸检测模型对待标注人脸数据集中图片的人脸进行检测,以获得 标识人脸位置的边框; 检测该图片中边框数量是否为0,或者是边框数量是否超过预设的上限值; 如果是,设置该图片的标注信息无效; 如果不是,获取该图片中所有的边框,利用NMS算法在该图片的所有边框中,剔除 IOU大于预设值的边框,得到所述该图片中人脸位置。 优选地,所述接收用户针对样本中每个图片在人脸位置录入的人脸名字,完成待 标注人脸数据集中图片的标注具体包括: 获取所述样本; 接收用户针对样本中每个图片的人脸位置从预设的待标注人物库中选择对应的 待标注人物,完成待标注人脸数据集中图片的标注。 第二方面,一种基于深度学习的人脸数据集标注系统,包括: 待标注人脸数据集:包含多个图片; 人脸检测模型; 在线预测服务:用于利用人脸检测模型对待标注人脸数据集中图片的人脸进行检 测,得到各个图片中人脸位置,以获得样本; 标注工具:用于接收用户针对样本中每个图片在人脸位置录入的人脸名字,完成 待标注人脸数据集中图片的标注。 优选地,所述在线预测服务具体用于: 加载人脸检测模型和待标注人脸数据集; 利用人脸检测模型对待标注人脸数据集中图片的人脸进行检测,以获得标识人脸 位置的边框; 检测该图片中边框数量是否为0,或者是边框数量是否超过预设的上限值; 如果是,设置该图片的标注信息无效; 如果不是,获取该图片中所有的边框,利用NMS算法在该图片的所有边框中,剔除 IOU大于预设值的边框,得到所述该图片中人脸位置。 优选地,所述标注工具具体用于: 获取所述样本; 接收用户针对样本中每个图片的人脸位置从预设的待标注人物库中选择对应的 5 CN 111597936 A 说 明 书 3/8 页 待标注人物,完成待标注人脸数据集中图片的标注。 第三方面,一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输 入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机 程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行第一方面所述的方法。 第四方面,一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所 述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行第一方面 所述的方法。 由上述技术方案可知,本发明提供的基于深度学习的人脸数据集标注方法、系统、 终端及介质,极大地提高人脸数据集的标注效率,能够为人脸检测或人脸识别模型的训练 提供大量准确的样本。 附图说明 为了更清楚地说明本发明
分享到:
收藏