logo好方法网

基于凸多面体分段线性分类的二叉划分树车牌识别方法


技术摘要:
本发明公开了一种基于凸多面体分段线性分类的二叉划分树车牌识别方法,该方法首先将车牌图像分割成独立的字符图像,计算每类车牌字符图像样本集的质心并创建根节点;然后创建超平面划分质心组,对一个质心的组创建叶节点;对两个质心的组创建内部节点,并通过组合分类  全部
背景技术:
近年来,深度学习取得了显著的发展。然而,由于其较高的计算成本和模型复杂 度,它在一些场景中的应用依然是有限的,如小型侦察机器人、智能相机和便携式设备等。 由于分段线性分类器(PLC)可以使用超平面的组合来逼近真实的分类边界,因此实现起来 非常简单,并且对内存的要求很低。在车牌识别问题中,PLC的设计一直是一个备受关注的 研究课题。 在过去的几十年里,人们提出了许多构建PLC的方法。线性规划是一个非常早期的 方法,但是模型需要进行多次优化,计算量很大。局部训练方法在PLC的设计中表现良好,但 往往导致过拟合或欠拟合问题。决策树是构建PLC的另一种策略,但模型往往需要花费大量 的时间来使错误率低于某个可接受的阈值。PLC也可以通过最大-最小可分性的方法来构 建,它是多面体可分性的一种泛化方法,但是最大-最小可分性方法可能需要一组预先指定 的整数来描述如何组织线性函数。 除了上述方法外,几何方法通常能提供一个简单直观的解决方案。典型的模式是 利用输入点的凸包来学习分类器。众所周知的支持向量机(SVM)可以将求解最优超平面的 问题转化为寻找线性可分条件下凸包之间的最近点的问题。事实上,支持向量机的几何解 释在特征表示上是等价的。为了实现对偶性,一些著名的最近点算法,如Gilbert- Schlesinger-Kozinec(GSK)和Mitchell-demyanov-malozemov(MDM)被提出来直接解决线 性可分问题。此外,多凸线性感知器(multiconlitron)作为PLC设计的一般几何方法被提了 出来,其原始的构造算法称为SMA算法。利用SMA,能生成一系列的超平面,并组装成一个多 连通体。凸多面体学习为分段线性分类问题提供了另一种几何求解方法。凸多面体学习的 目的是构造一个凸多面体分类器,它在一些数据不平衡的特殊分类问题上能表现出良好的 效果。 然而,现有的凸多面体分类器存在其局限性。第一点,合成一个具有合适数量超平 面的凸多面体分类器是一个具有挑战性的任务,现有的构造凸多面体分类器的方法计算量 大,包含太多的参数,因此调优过程非常困难。第二点,现有凸多面体分类方法本质上都局 限于二分类,但大多数真实的场景都对应于多分类问题。
技术实现要素:
本发明的目的在于针对现有技术的不足,提供一种基于凸多面体分段线性分类的 二叉划分树车牌识别方法。 本发明的目的是通过以下技术方案来实现的:一种基于凸多面体分段线性分类的 二叉划分树车牌识别方法,包括以下步骤: 5 CN 111598080 A 说 明 书 2/16 页 (1)获得车牌图像,提取车牌字符图像样本特征数据。 (2)根据步骤(1)提取的车牌字符图像样本特征数据和对应的字符类别构建二叉 划分树,包括以下子步骤: (2.1)输入K类字符图像样本特征数据集合T={Classj|j=1~K},设置精度参数ε 等;其中每类样本 由Nj个n维的车牌字符图像样本特征数据 组成。 (2.2)计算每类样本Classj的质心 并创建一个根节点。 (2.3)找到距离最远的两个样本类的质心 和 根据 和 将所有样本类的质 心分成 和 两组,包括以下子步骤: (2.3.1)初始化两个组 和 为: (2.3.2)根据其它样本类的质心到 和 的距离,将其它样本类的质心分配到与 其最近的组中,并计算超平面分离组 和 (2.4)根据步骤(2.3)得到的组 和 创建根节点的子节点为内部节点或叶节 点,具体为: 如果组 或 中只包含一个质心,则在根节点下创建对应的叶节点。 如果组 或 中包含两个质心,则在根节点下创建该组对应的内部节点,并计 算两个质心的组的分段线性边界分离质心组,对两个质心分别创建叶节点作为内部节点的 子节点。 如果组 或 中不止两个质心,则在根节点下创建该组对应的内部节点,根据 步骤(2.3)的操作找到组内最远的两个质心并计算超平面分离质心组,根据新的质心组中 质心的个数创建内部节点的子节点,如只有一个质心则对其创建叶节点,如有两个质心则 对其创建内部节点并计算两个质心的组的分段线性边界分离质心组后创建对应两个叶节 点,如不止两个质心则对其创建内部节点并计算超平面分离质心组后再根据新的质心组中 质心的个数创建子节点,直到子节点均为叶节点。 (2 .5)为步骤(2.4)创建的叶节点分配对应的样本类的标签,最终得到二叉划分 树。 (3)将待识别车牌图像经过步骤(1)的操作得到每个车牌字符图像的样本特征数 据后,输入步骤(2)构建的二叉划分树,找到样本特征数据对应的分类,最后得到车牌字符 的识别结果。 进一步地,所述步骤(2.4)中计算两个质心的组的分段线性边界分离质心组,包括 以下子步骤: (2.4.1)将两个质心所属类Classj的样本作为点集X,Y; (2.4.2)初始化线性判别函数集 (2.4.3)计算线性判别函数候选集CLDFs: 6 CN 111598080 A 说 明 书 3/16 页 如果点集Y存在 使得 不存在,则从点集Y中删除 后跳转至步骤(2.4.2); (2.4.4)根据下式找到距离凸包点集CH(X)最近的点 (2.4.5)从步骤(2.4.3)得到的线性判别函数候选集CLDFs中选择步骤(2.4.4)中 对应的 将其放入线性判别函数集LDFs; (2.4.6)去掉点集Y中满足 的 (2.4.7)重复迭代步骤(2.4.4)~(2.4.6)直到点集 输出线性判别函数集 LDFs,得到分段线性边界。 进一步地,所述步骤(2.4.3)中计算线性判别函数候选集CLDFs,涉及到计算多个 独立的 与凸包点集CH(X)之间的线性判别函数LDFs,包括以下子步骤: (2.4.3.1)取任意 (2.4.3.2)初始化 到凸包点集CH(X)中距离最近的 其中, (2.4.3.3)在点集X中找到满足如下条件的 (2.4.3.4)通过下式更新 (2.4.3.5)重复迭代步骤(2.4.3.2)~(2.4.3.4)直到满足如下条件: (2.4.3.6)遍历 计算线性判别函数 得到分段线性边界 将 放入线性判别函数候选集CLDFs;其中, 如果存在 使得 则 不存在。 进一步地,所述步骤(2.2)中计算每个样本类Classj的质心 为: 进一步地,所述步骤(2.3.2)中超平面通过下式的得到: 7 CN 111598080 A 说 明 书 4/16 页 其中, 为质心 所属类中的第i维坐标。 进一步地,所述精度参数ε=10-3。 进一步地,所述字符图像的种类的集合为{"皖","沪","津","渝","冀","晋"," 蒙","辽","吉","黑","苏","浙","京","闽","赣","鲁","豫","鄂","湘","粤","桂"," 琼","川","贵","云","藏","陕","甘","青","宁","新","警","学","A","B","C","D"," E","F","G","H","J","K","L","M","N","P","Q","R","S","T","U","V","W","X","Y"," Z","0","1","2","3","4","5","6","7","8","9"},共有K=69个类。 进一步地,所述步骤(1)包括以下子步骤: (1.1)对车牌图像进行图像预处理,包括灰度化、灰度拉伸、同态滤波、图像平滑; (1.2)定位并校正车牌图像中的字符区域,包括以下子步骤: (1.2.1)采用OTSU算法对步骤(1.1)预处理的车牌图像二值化,区分前景像素点和 背景像素点; (1.2.2)采用连通域标记法标记步骤(1.2.1)得到的二值化图像,划分连通域; (1.2.3)删除步骤(1.2.2)得到的非字符连通域; (1.2.4)根据连通域的距离合并步骤(1.2.3)保留的连通域划分为车牌动态数组, 并删除合并的连通域少于5的车牌动态数组,剩余车牌动态数组中的连通域的最小外接矩 形区域为车牌图像中的字符区域; (1.2.5)采用拉东变换对步骤(1.2.4)中字符区域内的车牌图像进行倾斜校正,得 到车牌字符图像; (1.3)采用水平投影法分割车牌字符图像得到独立的字符图像; (1.4)分别提取步骤(1.3)得到的字符图像的HOG特征和LBP特征;其中,HOG特征的 维度为nh,LBP特征的维度为nl; (1.5)组合步骤(1.4)得到的HOG特征和LBP特征得到最终的车牌字符图像样本特 征数据,维度为n=nh nl。 本发明的有益效果是:本发明基于凸多面体分段线性分类的二叉划分树车牌识别 方法,是一种基于速度更快、分类能力更强、精度更高的分类器的车牌识别方法,可以处理 复杂的多分类任务,具有良好的泛化能力,可实现数据样本的快速分类,并且可以调整精 度;实现起来非常简单,具有直观的几何解释和较低的内存要求;不需要执行冗长的优化过 程,也不需要调优任何参数;在分类效率和计算时间上都优于现有的分段线性分类器,其计 算复杂度更低,在维度上的适应性更好,能以较低的模型复杂度实现较高的车牌字符识别 精度;对于将分段线性分类器嵌入到实时系统或便携式终端中具有重要意义,也为凸多面 体学习提供了一个几何基础,可以应用于计算几何领域,解决凸包相关的问题。因此,本发 明是分段线性分类和图像识别领域的一个显著的进步。 附图说明 图1为本发明设计的计算 与凸包点集CH(X)之间的超平面的示意图; 8 CN 111598080 A 说 明 书 5/16 页 图2是本发明设计的超平面不存在的特例以及计算两个质心的组的分段线性边界 (CPPLC)的示意图; 图3是本发明提出的基于凸多面体分段线性分类的二叉划分树车牌识别方法 (HBPT-CPPLC)的示意图; 图4将本发明用于车牌图像识别的流程示意图; 图5是同态滤波函数的示意图。
下载此资料需消耗2积分,
分享到:
收藏