logo好方法网

一种文本识别方法、装置、设备及存储介质


技术摘要:
本申请提出一种文本识别方法、装置、设备及存储介质,该方法包括:获取待识别图像的图像特征,其中,所述图像特征为,能够以其为依据预测所述待识别图像中包含的字符信息的图像特征,所述字符信息包括字符种类,以及各种类字符在所述待识别图像中出现的次数;利用所述  全部
背景技术:
光学字符识别(Optical  Character  Recognition,简称OCR)是计算机视觉的一个 研究分支,其目标是从图像数据中识别出字符,并保存为计算机文本数据。 传统的光学字符识别方法通常是先从图像中检测字符位置,然后对各个字符位置 进行字符识别,确定图像中所包含的字符。当图像内容复杂时,传统的光学字符识别方法通 常无法准确地识别出图像中的字符内容,例如对自然场景图像进行字符识别时,由于图像 内容排布不规则,经常出现识别结果多字或少字的现象。
技术实现要素:
基于上述技术现状,本申请提出一种文本识别方法、装置、设备及存储介质,能够 以更高的准确度识别图像文本。 一种文本识别方法,包括: 获取待识别图像的图像特征,其中,所述图像特征为,能够以其为依据预测所述待 识别图像中包含的字符信息的图像特征,所述字符信息包括字符种类,以及各种类字符在 所述待识别图像中出现的次数; 利用所述图像特征进行文本识别处理,得到对所述待识别图像的文本识别结果。 一种文本识别装置,包括: 特征获取单元,用于获取待识别图像的图像特征,其中,所述图像特征为,能够以 其为依据预测所述待识别图像中包含的字符信息的图像特征,所述字符信息包括字符种 类,以及各种类字符在所述待识别图像中出现的次数; 文本识别单元,用于利用所述图像特征进行文本识别处理,得到对所述待识别图 像的文本识别结果。 一种文本识别设备,包括: 存储器和处理器; 其中,所述存储器与所述处理器连接,用于存储程序; 所述处理器,用于通过运行所述存储器中的程序,实现上述的文本识别方法。 一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执 行时,实现上述的文本识别方法。 本申请提出的文本识别方法能够实现对待识别图像的文本识别,并且,按照本申 请提出的文本识别方法,能够获取待识别图像的更加准确、更利于文本识别的图像特征,该 图像特征具体是,能够以其为依据准确预测所述待识别图像中包含的字符种类,以及各种 类字符在待识别图像中出现的次数的图像特征。基于本申请提出的文本识别方法从待识别 5 CN 111582282 A 说 明 书 2/18 页 图像中获取的图像特征的上述特点,采用本申请提出的文本识别方法对待识别图像进行文 本识别时,能够准确识别出待识别图像中所包含的字符种类,并且能够准确识别各类字符 在待识别图像中出现的次数,从而可以避免文本识别过程中出现多字或少字的现象,使得 对待识别图像的文本识别结果更准确。 附图说明 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据 提供的附图获得其他的附图。 图1(a)和图1(b)是本申请实施例提供的自然场景图像示例图; 图2是本申请实施例提供的一种文本识别方法的流程示意图; 图3是本申请实施例提供的一种文本识别模型的架构示意图; 图4(a)是本申请实施例提供的进行图像矫正处理前的图像示例图; 图4(b)是本申请实施例提供的对图4(a)所示的图像进行图像矫正处理后的图像 示例图; 图5是本申请实施例提供的对文本识别模型进行训练的流程示意图; 图6是本申请实施例提供的度量字符识别结果与字符信息标签之间的差异的示意 图; 图7是本申请实施例提供的另一种文本识别模型的架构示意图; 图8是本申请实施例提供的一种文本识别装置的结构示意图; 图9是本申请实施例提供的一种文本识别设备的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏