logo好方法网

一种图像数据快速标注的方法及系统


技术摘要:
本发明公开了图像数据快速标注的方法及系统,所述方法包括:接收图像数据,根据预置的存储有多个算法模型的数据库检测是否存在与图像数据标注规则匹配的算法模型;当检测到与图像数据标注规则匹配的算法模型,根据所述算法模型对图像数据进行反向标注,生成反向标注结  全部
背景技术:
数据标注是通过数据加工人员借助标记工具,对人工智能学习数据进行加工的一 种行为。通常数据标注的类型包括:图像标注、语音标注、文本标注、视频标注等种类。 图像数据标注是对不同的目标标记物使用不同的标签,用标签来概述内容。但是 需要质检机制检验标注数据的可靠性,即采用等比例随机抽查的形式检验标准数据,不过, 由于图像数据标注的巨大需求量,会导致数据加工周期的漫长;其次,为保证质检结果的可 靠性,行业对质检工作人员的素质要求比标注工作人员更高,必须定期培训和考核。可见, 现阶段的图像数据标注工作需要耗费大量的人力资源和时间资源。
技术实现要素:
本发明所要解决的技术问题在于,提供一种图像数据快速标注的方法及系统,能 够利用反向标注技术,大大压缩了图像数据标注的时间损耗,利用过往的标注成果,节约人 力和时间,又使得算法可以快速更新,循环往复。 为了解决上述技术问题,本发明第一方面公开了图像数据快速标注的方法,所述 方法包括:接收图像数据,根据预置的存储有多个算法模型的数据库检测是否存在与所述 图像数据标注规则匹配的算法模型;当检测到与所述图像数据标注规则匹配的算法模型, 根据所述算法模型对所述图像数据进行反向标注,生成反向标注结果以实现图像数据快速 标注。 在一些实施方式中,根据所述算法模型对所述图像数据进行反向标注,包括:创建 与所述图像数据同名的XML文件;基于所述算法模型的标注规则对所述图像数据进行检测, 生成检测结果;将所述检测结果作为所述图像数据的标注结果写入所述XML文件。 在一些实施方式中,将所述检测结果作为所述图像数据的标注结果写入所述XML 文件后,还包括:将所述XML文件输出;接收人工修正指令,对所述XML文件的标注结果进行 修正。 在一些实施方式中,还包括:当未检测到与所述图像数据标注规则匹配的算法模 型,则通过所述图像数据对作业人员进行随机考核。 在一些实施方式中,通过所述图像数据对作业人员进行随机考核,包括:实时接收 输入的待标注的图像数据;将所述图像数据的其中一部分进行标注至符合预置的质检条 件;将所述符合预置的质检条件的图像数据和另一部分图像数据放入同一任务池,并生成 多组任务作业;接收任务作业的训练结果,根据所述已标注的图像数据对所述训练结果进 行考核,生成考核结果。 在一些实施方式中,考核结果包括合格,所述方法还包括:若所述考核结果为合 格,则判断作业人员的训练完成,并下发另一任务作业。 4 CN 111582388 A 说 明 书 2/8 页 在一些实施方式中,考核结果包括不合格,所述方法还包括:若所述考核结果为不 合格,则输出训练提醒;接收训练完成指令,对当前的任务作业进行修正。 在一些实施方式中,该方法还包括:判断所述反向标注结果是否符合预置的准确 率;判断所述反向标注结果是否符合预置的准确率;若所述反向标注结果符合所述预置的 准确率,则根据实时接收的待标注的图像数据对所述算法模型进行增量学习生成异代算法 模型存储至所述数据库;其中,所述异代算法模型与所述算法模型具有关联关系。 在一些实施方式中,判断所述反向标注结果是否符合预置的准确率之后,还包括: 若所述反向标注结果不符合所述预置的准确率,则根据实时接收的待标注的图像数据进行 人工修正;根据修正后的图像数据对所述算法模型进行增量学习生成异代算法模型存储至 所述数据库。 本发明第二方面公开了一种图像数据快速标注的系统,所述系统包括:数据库,存 储有多个算法模型;图像处理模块,用于接收图像数据,根据所述数据库检测是否存在与所 述图像数据标注规则匹配的算法模型;反向标注模块,用于在检测到与所述图像数据标注 规则匹配的算法模型,根据所述算法模型对所述图像数据进行反向标注,生成反向标注结 果以实现图像数据快速标注。 在一些实施方式中,该系统还包括:随机考核模块,用于在未检测到与所述图像数 据标注规则匹配的算法模型,则通过所述图像数据对作业人员进行随机考核。 与现有技术相比,本发明的有益效果在于: 实施本发明能够利用反向标注技术,在已有的算法模型上直接进行图像数据的标 注,大大压缩了数据标注的时间损耗,并且大幅度提高了标注效率。并且,通过对已有的模 型进行增量学习算法,渐进的进行数据更新,且能修正和加强以前的数据或算法模型,使得 更新后的数据或算法模型能适应新接收的数据,而不必重新对全部数据进行学习。降低了 对数据库的时间和空间的需求,更能满足实际要求。而且,还可以利用已有的标注数据作为 考核样本,检测标注人员的作业水平。若发现水平不达标者,可以及时止损,防止人力和时 间的继续浪费。并且通过补充培训,水桶式延长短板,提高业务能力,进而提高工作效率,增 加标注团队的平均产能。 附图说明 图1为本发明实施例公开的一种图像数据快速标注的方法的流程示意图; 图2为本发明实施例公开的另一种图像数据快速标注的方法的流程示意图; 图3为本发明实施例公开的另一种图像数据快速标注的方法的流程示意图; 图4为本发明实施例公开的一种图像数据快速标注的系统的结构示意图; 图5是本发明实施例公开的一种图像数据快速标注装置的结构示意图。
分享到:
收藏