logo好方法网

一种图形表格的定位分割方法及装置


技术摘要:
一种图形表格的定位分割方法及装置,包括如下步骤:将图形表格进行二值化处理得到第一图形;将第一图形进行形态学腐蚀膨胀,确定第一图形中的表格组成线得到第一表格;将第一表格进行高斯模糊和二值化处理得到第二图形;将第二图形再进行形态学腐蚀膨胀,然后基于第二  全部
背景技术:
在实际的生产生活中,尽管大多数表格都是由电子生成,但是其呈现形式却多是 pdf、图片等不可编辑模式,因此在使用中,需要进行图形表格的转换。现在多是采用电脑识 别的方式进行,但在一些虚线、细线、断线等难识别部位,有较大的可能性产生识别错误,而 此种错误,直接降低了识别结果的可用性,同时为后续的文字提取识别等工作带来了较大 的不确定性。现在解决这一问题的方法是提供一种认为干预借口,但这对于工作效率产生 了较大的影响,且并未从根本上解决这一问题。
技术实现要素:
为了解决上述问题,本申请一方面提出了一种图形表格的定位分割方法,包括如 下步骤:将图形表格进行二值化处理得到第一图形;将第一图形进行形态学腐蚀膨胀,确定 第一图形中的表格组成线得到第一表格;将第一表格进行高斯模糊和二值化处理得到第二 图形;将第二图形再进行形态学腐蚀膨胀,然后基于第二图形确定表格组成线分割图形表 格。本申请采用两次二值化处理和两次形态学腐蚀膨胀,将图形表格的组成线进行了有效 处理;第一次二值化是图片变成黑白,能够分离目标区域和背景区域,减少干扰,方便后面 处理,第二次二值化是再次二值化后,再膨胀的话能够把表格线加粗及对虚线、细线、断线 能够做一个补全,提高表格区域块定位的准确度;而形态学腐蚀膨胀方法能够把图片中的 文字消除,并且去除多余的干扰点或线,得到表格的横线及竖线,然后再通过横线竖线与运 算把图片中的整个表格还原出来。 优选的,还包括图形表格预处理的过程,所述图形表格预处理包括获取图形表格 的R通道图形。提取R通道能够将红色的印章排出掉,从而解决印章对表格线提取的干扰,因 为印章覆盖到表格线上,会导致提取表格线出现一大段断线的情况,因此进行预处理之后, 减少了干扰,比直接做图像灰度更有优势。 优选的,二值化处理采用自适应阈值进行处理;所述自适应阈值根据邻域块的像 素值分布来确定该像素位置上的二值化阈值。在图像阈值化操作中,需要关注的是二值化 图像中,去分离目标区域和背景区域,不同图片的背景不同,但是仅仅通过设定固定阈值很 难达到理想的分割效果。而自适应阈值,则是根据像素的邻域块的像素值分布来确定该像 素位置上的二值化阈值。这样做的优点:(1)每个像素位置处的二值化阈值不是固定不变 的,而是由其周围邻域像素的分布来决定的。(2)亮度较高的图像区域的二值化阈值通常会 较高,而亮度低的图像区域的二值化阈值则会相适应的变小。(3)不同亮度、对比度、纹理的 局部图像区域将会拥有相对应的局部二值化阈值。(4)自适应阈值能够灵活处理各种图像, 达到一个很好的效果。 优选的,获取第一表格之后,先进行颜色反转,然后再进行高斯模糊和二值化处理 3 CN 111611783 A 说 明 书 2/4 页 得到第二图形。 优选的,对于第二图形寻找轮廓以确定凸包,得到凸包坐标,并利用凸包坐标作为 基点将图形表格进行分割得到待识别字块。 优选的,根据凸包坐标进行第二图形重绘得到表格。 优选的,所述重绘表格的过程如下:对得到的凸包坐标中左上角的Y坐标值进行排 序和干扰值过滤,得到表格行数及每行的Y坐标值,再根据处理后的Y值对凸包坐标进行分 类,每一类再根据X坐标值进行排序,得到每个凸包在原表格上的位置,即完成利用凸包坐 标来还原原来的表格。本申请的寻找表格内的凸包相当于找表格区域块的内框,这样分割 出来的文字块区域能够避免表格线干扰,可以提高OCR对于框内文字的识别准确度。 优选的,将得到的待识别字块进行OCR识别,得到其中的文字;将得到的文字置于 重绘得到的表格中,即得到识别后的图形表格。 优选的,所述形态学腐蚀膨胀采用getStructuringElement算法进行图片处理,然 后再利用MORPH_RECT函数得到矩形。 另一方面,本申请还公开了一种图形表格的定位分割装置,包括如下模块: 预处理模块,用于将图形表格进行二值化处理得到第一图形; 正向处理模块,用于将第一图形进行形态学腐蚀膨胀,确定第一图形中的表格组 成线得到第一表格; 反向处理模块,用于将第一表格进行高斯模糊和二值化处理得到第二图形;将第 二图形再进行形态学腐蚀膨胀,然后基于第二图形确定表格组成线分割图形表格。 本申请能够带来如下有益效果:本申请采用两次二值化处理和两次形态学腐蚀膨 胀,将图形表格的组成线进行了有效处理;第一次二值化是图片变成黑白,能够分离目标区 域和背景区域,减少干扰,方便后面处理,第二次二值化是再次二值化后,再膨胀的话能够 把表格线加粗及对虚线、细线、断线能够做一个补全,提高表格区域块定位的准确度;而形 态学腐蚀膨胀方法能够把图片中的文字消除,并且去除多余的干扰点或线,得到表格的横 线及竖线,然后再通过横线竖线与运算把图片中的整个表格还原出来,二值化处理和形态 学腐蚀膨胀的交叉使用,保证了整个处理过程中有效信息(如横线、竖线)的获取,以及无效 信息(如框内文字)的排除;本申请的寻找表格内的凸包相当于找表格区域块的内框,这样 分割出来的文字块区域能够避免表格线干扰,可以提高OCR对于框内文字的识别准确度。 附图说明 此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申 请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中: 图1为第一个实施例的流程图; 图2为第二个实施例的流程图; 图3为待识别表格的演示图; 图4为第一表格的示意图; 图5为形成凸包以后映射到待识别表格的示意图; 图6为待识别字块的示意图; 图7为定位分割装置的示意图。 4 CN 111611783 A 说 明 书 3/4 页
分享到:
收藏