logo好方法网

试卷答案识别方法、系统、装置和计算机可读存储介质


技术摘要:
本发明提供了一种试卷答案识别方法、系统、装置和计算机可读存储介质,用于识别试卷中选择题的答案。试卷答案识别方法包括如下步骤:获取空白试卷的含有坐标的文本信息;根据文本信息,获取空白试卷中的选择题整体区域;根据选择题整体区域,获取答题试卷中每个选择题  全部
背景技术:
单元测验、考试等会出现在多种场景中,尤其是在学校。通常考试完成后产生的大 量试卷需要教师进行批改。绝大部分学校依旧是通过教师人工批改完成,所以通过计算机 智能阅卷的技术能够节省教师的阅卷时间。 现有的阅卷系统仅能够对自身系统定义的试卷板式进行制模(制作试卷模板)和 阅卷,而无法兼容其他厂商的试卷。如果在原卷上面进行作答,也无法识别,局限性大,而通 过教师手动批改完成阅卷,就占用了教师较多工作时间,形成了一定的工作量,增加了教师 的工作负担。
技术实现要素:
本发明旨在解决上述技术问题中的至少之一。 本发明的第一目的在于提供一种试卷答案识别方法。 本发明的第二目的在于提供一种试卷答案识别系统。 本发明的第三目的在于提供一种试卷答案识别装置。 本发明的第四目的在于提供一种计算机可读存储介质。 为实现本发明的第一目的,本发明的实施例提供了一种试卷答案识别方法,用于 识别试卷中选择题的答案,试卷答案识别方法包括如下步骤:获取空白试卷的含有坐标的 文本信息;根据文本信息,获取空白试卷中的选择题整体区域;根据选择题整体区域,获取 答题试卷中每个选择题对应的答案区域;根据答案区域识别每个选择题对应的答案。 在该技术方案中,空白试卷中的选择题往往作为一道大题,例如:题号为一.单选 题,下面会出现1、2、4、5、6等多个单选题。获取空白试卷的文本信息,该文本信息含有坐标, 获取坐标就能够对文本信息进行定位,当获取到选择题的文本信息,就可以对一个题号后 面所有的选择题区域进行定位,从而判断出选择题的位置,以能够获取到选择题整体区域, 进一步可以获取到该选择题整体区域内的答案选项,从而可以获取答案区域,在此答案区 域内的作答就是答案,在答案区域内识别答案,缩小了对答案识别的范围,因此可以较为快 捷和准确地识别出答案内容。通过获取含有坐标的文本信息、根据文本信息获取选择题区 域、根据带有坐标的选择题区域获取答案区域,根据答案区域识别出答案,这种逐渐缩小识 别范围的识别方式,能够提高识别效率和准确性。 另外,本发明提供的技术方案还可以具有如下附加技术特征: 上述技术方案中,根据选择题整体区域,获取答题试卷中每个选择题对应的答案 区域的步骤包括:获取每个选择题的第一矩形边界;根据第一矩形边界确定预答案区域;对 预答案区域的右边界进行扩展,以获取第二矩形边界;获取第二矩形边界作为答案区域的 4 CN 111553211 A 说 明 书 2/12 页 边界。 在该技术方案中,获取的文本信息是以行的形式呈现出来的,因此,通过获取行的 边界,就可以获取行的区域,而边界的获取方式简单,易于实现,从而可以较为容易地获取 到每个选择题的第一矩形边界,也就是,将选择题的文本信息的第一矩形边界作为选择题 区域。根据第一矩形边界提供的坐标信息,可以确定出预答案区域的矩形边界。在空白试卷 做答时,可能有的答案和题干出现交错,也就是,把答案写到了题目里面了,所以右扩答案 区域的像素点,尽可能保障答案完整。因此,为了防止获取的第一矩形边界不完整,可对预 答案区域的右边界进行扩展,得到第二矩形边界,将扩展后的第二矩形边界作为答案区域 的边界,以保证能够获取到完整的答案区域。例如,可以根据右边界得到答案区域,再向右 扩展30个像素点,就能够防止选择题区域的截取不完整。 上述任一技术方案中,获取每个选择题的第一矩形边界的步骤包括:遍历文本信 息;获取每个选择题中每行文本信息的左边界、右边界、上边界和下边界;根据每行文本信 息的左边界、右边界、上边界和下边界计算出每个选择题的第一矩形边界。 在该技术方案中,为了避免遗漏,通过遍历的方式获取选择题的每行的文本信息, 这样就可以得到每行文本信息的左边界,上边界、下边界和右边界,因为有的选择题不止一 行,当选择题有多行时,通过获取每行文本信息的左边界,上边界、下边界和右边界的坐标, 就可以计算出该到选择题边界的坐标,从而获取到每个选择题的第一矩形边界。 上述任一技术方案中,根据选择题区域,获取答题试卷中每个选择题对应的答案 区域的步骤包括:获取答题试卷的答题试卷图像;根据答题试卷图像获取答案区域中含有 答案的子区域;对子区域进行二值化处理,适于获取二值图;根据二值图获取选择题文字和 答案文字的所在行坐标;根据水平投影和行坐标获取每个案的上边界和下边界;根据答案 的上边界和下边界获取答案区域。 在该技术方案中,获取选择题区域,旨在确定的答案区域的右边界,答案区域的右 边界即为选择题区域的左边界,取左边界坐标的最小值作为答案区域的右边界,就能够快 速得到答案区域的右边界。整个选择题区域的上边界和下边界分别为答案区域的上边界和 下边界,从而可以得到所有的选择题的答案区域。通过投影方法可以得到每个选择题的答 案区域的矩形坐标,从而可以得到每个选择题对应的答案区域。 上述任一技术方案中,通过建立深度学习模型来实现根据答案区域识别每个选择 题对应的答案的步骤,建立深度学习模型的步骤包括:获取模型数据;根据模型数据建立网 络模型;对网络模型进行模型训练。 在该技术方案中,通过建立深度学习模型来实现对切割出的答案进行识别。通过 输入尽可能多的模型数据建立起深度学习的网络模型,再通过对网络模型进行模型训练, 可以提高深度学习模型的识别效率和准确率 上述任一技术方案中,获取模型数据的步骤包括:获取多张不同手写习惯的第一 答案子图;通过投影删除每个答案子图中除答案内容的空白部分;获取含有答案内容的第 二答案子图;对第二答案子图进行白色扩充;获取含有答案内容的第三答案子图。 在该技术方案中,获取的模型数据越多,越有利于建立起稳固的深度学习模型,每 张图片数据的选择题答案就均包含了一种手写习惯,多张图片数据就包含了不同的手写习 惯,从而进一步提高了深度学习模型的结构稳定性。为了便于描述,将获取的原始的数据图 5 CN 111553211 A 说 明 书 3/12 页 片设定为第一答案子图。然后通过投影的方式,将每个第一答案子图的空白部分抛去,只保 留答案内容部分,从而获取到了第二答案子图,能够提高识别倾斜度。然后对第二答案子图 进行扩充白色底图,并统一处理为预设的尺寸,获取到第三答案子图。第三答案子图的尺寸 是根据预设尺寸的相对固定的尺寸,能够提高识别效率。 上述任一技术方案中,根据模型数据建立网络模型的步骤包括:构建自下而上的 卷积神经网络结构;构建自上而下的过程结构;构建特征与特征之间的侧边连接结构;构建 训练模型。 在该技术方案中,通过算法结构实现网络模型的建立,算法结构可以分为三个部 分,其中,自下而上的部分是卷积神经网络的前向过程。在前向过程中,特征图的大小在经 过某些层后会改变,而在经过其他一些层的时候不会改变,不改变特征图大小的层归为一 个阶段,因此每次抽取的特征都是每个阶段的最后一个层的输出,这样就能构成特征金字 塔。通过该方法步骤建立起的网络模型结构稳定,具有较高的辨识率,能够提高识别效率和 准确率。 为实现本发明的第二目的,本发明的实施例提供了一种试卷的答案识别系统,用 于实现任一实施例中的试卷答案识别方法,包括:文本获取模块,适于获取空白试卷的含有 坐标的文本信息;第一区域模块,与文本获取模块信号连接,适于根据文本获取模块获取的 文本信息,获取空白试卷中的选择题区域;第二区域模块,与第一区域模块信号连接,适于 根据第一区域模块获取的选择题区域,获取答题试卷中每个选择题的答案区域;答案识别 模块,与第二区域模块信号连接,适于根据第二区域模块获取的答案区域,获取每个选择题 的答案。 在该技术方案中,通过文本获取模块获取空白试卷的文本信息,该文本信息含有 坐标,获取坐标就能够对文本信息进行定位,当获取到选择题的文本信息,就可以通过第一 区域模块对选择题的选择题区域进行定位,从而判断出选择题的位置,以能够获取到选择 题区域,进一步可以获取到该选择题区域内的答案选项,从而通过第二区域模块可以获取 答案区域,在此答案区域内的作答就是答案,在答案区域内通过答案识别模块识别出答案, 缩小了对答案识别的范围,因此可以较为快捷和准确地识别出答案内容。通过获取含有坐 标的文本信息、根据文本信息获取选择题区域、根据选择题区域获取答案区域,根据答案区 域识别出答案,这种逐渐缩小识别范围的识别方式,能够提高识别效率和准确性。 为实现本发明的第三目的,本发明的实施例提供了一种试卷答案识别装置,包括: 存储器,存储有计算机程序;处理器,执行计算机程序; 其中,处理器在执行计算机程序时,实现本发明任一实施例中的试卷答案识别方 法的步骤。 在该技术方案中,本发明的实施例提供的试卷答案识别装置实现如本发明任一实 施例中试卷答案识别方法的步骤,因此其具有本发明任一实施例中试卷答案识别方法的全 部有益效果。 为实现本发明的第四目的,本发明的实施例提供了一种计算机可读存储介质,包 括:计算机可读存储介质存储有计算机程序,计算机程序被执行时,实现本发明任一实施例 中试卷答案识别方法的步骤。 本发明的实施例提供的计算机可读存储介质实现如本发明任一实施例中试卷答 6 CN 111553211 A 说 明 书 4/12 页 案识别方法的步骤,因此其具有本发明任一实施例中试卷答案识别方法的全部有益效果。 本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践 了解到。 附图说明 图1为本发明一个实施例的试卷答案识别方法的流程图之一; 图2为本发明一个实施例的试卷答案识别方法的流程图之二; 图3为本发明一个实施例的试卷答案识别方法的流程图之三; 图4为本发明一个实施例的试卷答案识别方法的流程图之四; 图5为本发明一个实施例的试卷答案识别方法的流程图之五; 图6为本发明一个实施例的试卷答案识别方法的流程图之六; 图7为本发明一个实施例的试卷答案识别方法的流程图之七; 图8为本发明一个实施例的试卷答案识别方法的流程图之八; 图9为本发明一个实施例的试卷答案识别方法的空白试卷图; 图10为本发明一个实施例的试卷答案识别方法的建立网络模型的原理图; 图11为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之一; 图12为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之二; 图13为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之三; 图14为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之四; 图15为本发明一个实施例的试卷答案识别方法的实施步骤中显示结果图之六; 图16为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之 一; 图17为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之 二; 图18为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之 三; 图19为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之 四; 图20为本发明一个实施例的试卷答案识别方法的具体操作过程中显示结果图之 六; 图21为本发明一个实施例的试卷答案识别系统的组成示意图; 图22为本发明一个实施例的试卷答案识别装置的组成示意图。 其中,图1至图22中的附图标记与部件名称之间的对应关系为: 100:试卷答案识别系统,110:文本获取模块,120:第一区域模块,130:第二区域模 块,140:答案识别模块,200:试卷答案识别装置,210:存储器,220:处理器。
分享到:
收藏