logo好方法网

一种基于图像复杂度的彩色文本图像二值化方法及系统


技术摘要:
本发明公开了一种基于图像复杂度的彩色文本图像二值化方法及系统,包括:对获取的彩色文本图像提取颜色特征和几何特征,分别计算颜色复杂度和几何复杂度,并根据颜色复杂度和几何复杂度计算图像复杂度;根据图像复杂度对彩色文本图像分类,并分别进行二值化,得到初始  全部
背景技术:
本部分的陈述仅仅是提供了与本发明相关的
技术实现要素:
信息,不必然构成在先技 术。 图像或视频中的文本信息,对图像或视频起着说明和诠释的作用,提取和识别这 些文本信息对图像理解、视频内容分析、智能交通、机器视觉、智能控制等方面有着重要的 意义。然而,这些文本信息通常处于彩色的复杂背景中,通用的OCR系统很难识别出文本信 息。 现有的二值化方法通常包括基于阈值的方法、基于聚类的方法和基于统计学习的 方法。基于阈值的方法通过设定阈值将图像分为文本区域和背景区域,通常包括全局阀值 和局部阀值两种;该种方法一般适用于图像背景比较单一的情况。 基于聚类的方法一般利用颜色信息将文本块图像分为几类,然后根据某一聚类算 法和设定的阀值将符合规则的类聚合,文本像素对应其中的一类,其余各类均为背景;但是 当背景中含有与文本颜色相同或相近的成分时,该方法会产生大量的残余背景,影响OCR识 别。 基于统计模型的方法对文本块中的所有像素建立概率模型,然后设定合理的概率 模型中的参数,根据最大似然法则确定每个像素是否属于文本像素;但是概率模型方法中 模型参数一般需要统计学习得到,需要大量的学习样本。 综上,发明人认为,上述各种文本图像二值化方法,均没考虑图像复杂度情况,无 论低复杂度图像还是高复杂度图像均采用单一的二值化方法;而对于复杂度低的图像如果 采用复杂的方法,会加重计算量;对于复杂度高的图像,采用简单的方法,达不到期望的二 值化效果。
分享到:
收藏