logo好方法网

模型训练方法、图像处理方法、装置、计算机系统和介质


技术摘要:
本公开提供了一种模型训练方法,应用于计算机系统。该方法包括:构建初始网络模型。获取包含冠字号字符的多个样本图像和该多个样本图像各自的标签集,多个样本图像中的每个样本图像的标签集包括:针对该样本图像中每个像素点的类别标签。然后,基于多个样本图像和多个  全部
背景技术:
为了保障社会的公平,打击违法犯罪行为,对纸币的流通进行有效的监督具有重 要的现实意义。冠字号作为纸币唯一识别标志,冠字号的监控是监控纸币流通过程的重要 环节。为了能够正确识别冠字号,需要得到完整且准确的单个字符的位置。因此,研究出高 速且有效的纸币冠字号区域字符分割方法是监控纸币冠字号过程中不可或缺的一步。 传统的方法一般采用基于阈值的分割方法区分出字符像素和背景像素,再采用投 影等方法确定单个字符的位置,从而实现字符的分割。由于纸币图像的复杂性,很难通过阈 值完全分割开字符像素和背景像素,二值图像会出现字符间粘粘或者字符笔画断裂等情 况。传统的投影分割法的结果太依赖于二值化的结果,因此传统的分割算法存在很多的局 限性。
技术实现要素:
本公开的一个方面提供了一种模型训练方法,应用于计算机系统。该方法包括:构 建初始网络模型。获取包含冠字号字符的多个样本图像和该多个样本图像各自的标签集, 多个样本图像中的每个样本图像的标签集包括:针对该样本图像中每个像素点的类别标 签。然后,基于多个样本图像和多个样本图像各自的标签集,对初始网络模型进行训练,以 得到目标网络模型,目标网络模型用于进行冠字号字符的分割。 可选地,上述基于多个样本图像和多个样本图像各自的标签集,对初始网络模型 进行训练包括:针对多个样本图像中的任一样本图像,将该样本图像输入至初始网络模型, 以由初始网络模型输出针对该样本图像中每个像素点的分类预测得分。基于该样本图像中 每个像素点的分类预测得分和该样本图像的标签集,计算预定损失函数的损失值。基于预 定损失函数的损失值,对初始网络模型的参数进行调整,以得到更新的初始网络模型。针对 更新的初始网络模型,重复上述训练过程,直至基于预定损失函数的损失值确定预定损失 函数实现收敛。将预定损失函数实现收敛时所针对的初始网络模型作为目标网络模型。 可选地,上述初始网络模型包括:多个第一卷积层、第二卷积层、第三卷积层、第四 卷积层、第一反卷积层、第二反卷积层和输出层。上述将任一样本图像输入至所述初始网络 模型,以由初始网络模型输出针对该样本图像中每个像素点的分类预测得分包括:针对任 一样本图像,依次利用上述多个第一卷积层和上述第二卷积层进行处理,以得到第一特征 图,第一特征图的尺寸与该样本图像的尺寸相同。利用上述第三卷积层对多个第一卷积层 中的一个第一卷积层的输出进行处理,以得到第二特征图,第二特征图的尺寸小于该样本 图像的尺寸。利用第一反卷积层对第二特征图进行处理,以得到第三特征图,第三特征图的 尺寸大于等于该样本图像的尺寸。利用第四卷积层对上述第二卷积层的输出进行处理,以 5 CN 111723815 A 说 明 书 2/13 页 得到第四特征图,第四特征图的尺寸小于该样本图像的尺寸。利用第二反卷积层对第四特 征图进行处理,以得到第五特征图,第五特征图的尺寸大于等于该样本图像的尺寸。接着, 对第三特征图和第五特征图进行融合,以得到融合结果。利用上述输出层基于融合结果,得 到针对该样本图像中每个像素点的分类预测得分。 可选地,初始网络模型还包括随机失活层,随机失活层位于上述第二卷积层之后。 上述基于多个样本图像和多个样本图像各自的标签集,对初始网络模型进行训练还包括: 将多个样本图像划分为多个训练批次,逐训练批次地对初始网络模型进行训练。当基于多 个训练批次中的每个训练批次对初始网络模型进行训练时,利用随机失活层设置初始网络 模型中的一个或多个神经元失活。 可选地,第三特征图和第五特征图的尺寸均大于该样本图像的尺寸。上述基于多 个样本图像和多个样本图像各自的标签集,对初始网络模型进行训练还包括:在对第三特 征图和第五特征图进行融合之前,对第三特征图和第五特征图进行裁剪,使得裁剪后的第 三特征图的尺寸、裁剪后的第五特征图的尺寸均与该样本图像的尺寸相同。 可选地,上述对第三特征图和第五特征图进行融合包括:将第三特征图和第五特 征图中位于相同通道的特征值进行相加,以得到初步融合图,并利用预定卷积核对初步融 合图进行卷积操作,以得到融合结果。 可选地,上述多个第一卷积层中的每个第一卷积层包括多个第一卷积核,上述多 个第一卷积核中的每个第一卷积核的尺寸为3×3,填充为1,步长为1。上述第二卷积层包括 多个第二卷积核,多个第二卷积核中的每个第二卷积核的尺寸为1×1,填充为0,步长为1。 可选地,上述第三卷积层和上述第四卷积层各自包括2个第三卷积核,每个第三卷 积核的尺寸为1×1。上述第一反卷积层和上述第二反卷积层各自包括一个第四卷积核,每 个第四卷积核的尺寸为3×3。 可选地,上述多个第一卷积层采用第一激活函数,上述第二卷积层采用第二激活 函数,上述输出层采用第三激活函数。 可选地,预定损失函数包括:交叉熵损失函数。 本公开的另一个方面提供了一种图像处理方法,应用于计算机系统。该方法包括: 获取待处理图像。获取根据上文所述的模型训练方法训练得到的目标网络模型。将待处理 图像输入至目标网络模型,以由目标网络模型输出针对待处理图像中每个像素点的分类预 测得分。基于每个像素点的分类预测得分,确定该像素点的类别。再基于每个像素点的类 别,从待处理图像中分割出冠字号字符。 本公开的另一个方面提供了一种模型训练装置,应用于计算机系统。该装置包括: 网络构建模块、样本获取模块和训练模块。网络构建模块用于构建初始网络模型。样本获取 模块用于获取包含冠字号字符的多个样本图像和该多个样本图像各自的标签集,多个样本 图像中的每个样本图像的标签集包括:针对该样本图像中每个像素点的类别标签。训练模 块用于基于多个样本图像和多个样本图像各自的标签集,对初始网络模型进行训练,以得 到目标网络模型,目标网络模型用于进行冠字号字符的分割。 本公开的另一个方面提供了一种图像处理装置,应用于计算机系统。该装置包括: 第一获取模块、第二获取模块、预测模块、确定模块和分割模块。第一获取模块用于获取待 处理图像。第二获取模块用于获取根据上文所述的模型训练方法训练得到的目标网络模 6 CN 111723815 A 说 明 书 3/13 页 型。预测模块用于将待处理图像输入至目标网络模型,以由目标网络模型输出针对待处理 图像中每个像素点的分类预测得分。确定模块用于基于每个像素点的分类预测得分,确定 该像素点的类别。分割模块用于基于每个像素点的类别,从待处理图像中分割出冠字号字 符。 本公开的另一方面提供了一种计算机系统,包括:存储器、处理器及存储在存储器 上并可在处理器上运行的计算机程序,处理器执行计算机程序时用于实现如上所述的方 法。 本公开的另一方面提供了一种计算机可读存储介质,存储有计算机可执行指令, 所述指令在被执行时用于实现如上所述的方法。 本公开的另一方面提供了一种计算机程序,所述计算机程序包括计算机可执行指 令,所述指令在被执行时用于实现如上所述的方法。 根据本公开的实施例,根据本公开实施例的模型训练方法采用深度学习方法构建 并训练网络模型,以使网络模型具备针对图像中每个像素点进行较为精确地分类的性能。 由于作为训练样本的多个样本图像包含冠字号字符,且多个样本图像可以是各种场景下获 取到的图像,样本图像中所包含的噪声和干扰可以被网络模型所学习以与有效图像特征加 以区分。使得后续在根据本公开实施例的图像处理方法中利用训练得到的网络模型进行冠 字号字符分割过程能够适应于整张复杂的图片信息,且能够灵活地应对复杂背景和噪声的 干扰,具有较高的鲁棒性差。 附图说明 为了更完整地理解本公开及其优势,现在将参考结合附图的以下描述,其中: 图1示意性示出了根据本公开实施例的应用模型训练方法和图像处理方法的示例 性系统架构; 图2示意性示出了根据本公开实施例的业务数据处理方法的流程图; 图3示意性示出了根据本公开实施例的初始网络模型的示例结构图; 图4示意性示出了根据本公开实施例的随机失活操作的示例示意图; 图5示意性示出了根据本公开实施例的网络模型中特征图变换过程的示例示意 图; 图6示意性示出了根据本公开实施例的图像处理方法的流程图; 图7示意性示出了根据本公开实施例的模型训练装置的框图; 图8示意性示出了根据本公开实施例的图像处理装置的框图;以及 图9示意性示出了根据本公开实施例的计算机系统的框图。
分享到:
收藏