logo好方法网

试卷批改方法和试卷批改装置


技术摘要:
本发明提出了一种试卷批改方法和试卷批改装置。其中,试卷批改方法包括:获取试题图像和答题区域规则;根据答题区域规则和试题图像,确定答题区域图像;识别答题区域图像中的答题文本信息;比对答题文本信息和试题图像对应的标准答案信息;根据答题文本信息和标准答案  全部
背景技术:
随着人工智能在教育领域的广泛应用,越来越多智能阅卷和智能批改的方法层出 不穷。目前的智能批改大致可以分为以下三类:基于字符串匹配的批改,基于混淆规则的精 确批改和基于样本集的运用机器学习算法的粗粒度批改。其中,基于字符串的匹配,对于一 些同义的子答案,无法很好的区分;基于混淆规则的精确批改,需要人工设定规则,会有些 地方考虑不周,规则的定义,直接影响到了批改结果;基于深度学习算法的粗粒度批改,需 要大量训练样本集,而且没有很好的移植性,如果科目题目变化的话,模型需要重新训练。 目前无论是哪类智能批改方法,都存在一些问题,即无法很好地灵活满足各学科 的填空题目的纸质版批改。目前大部分的智能批改还是在线电子版的批改,需要运用答题 卡,但是,对于中小学生的作业和考试,纸质版是最多,为了减轻老师批改的负担,批改的精 确度,很有必要提出一种纸质版和在线版各种学科的填空题都能够精确地批改的方法。
技术实现要素:
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。 为此,本发明第一方面在于提出了一种试卷批改方法。 本发明的第二方面在于提出了一种试卷批改装置。 有鉴于此,根据本发明的第一方面,提出了一种试卷批改方法,包括:获取试题图 像和答题区域规则;根据答题区域规则和试题图像,确定答题区域图像;识别答题区域图像 中的答题文本信息;比对答题文本信息和试题图像对应的标准答案信息;根据答题文本信 息和标准答案信息的比对结果批改试卷。 本发明提供的试卷批改方法,获取试卷每一道题目的试题图像,根据答题区域规 则对试题图像进行图像处理,并从试题图像中分割出答题区域图像,其中,答题区域规则为 用户预先设置的答题区域识别条件,例如填空题的答题区为直线,选择题的答题区为括号 等,通过识别答题区域图像中的答题文本信息,获得每一道题的手写作答内容,然后将答题 文本信息与标准答案进行比较,获得该道答题的批改结果,例如两者相同,则作答正确;不 相同,则作答错误,批改的方式可以为在每道题目的答案处标记√或×。一方面,实现纸质 试卷客观题的智能化批改,避免了在普通考试的过程中如果没有答题卡只能通过老师进行 人工阅卷的问题,可大量节省老师的时间,提高批改试卷的效率,减少出错;另一方面,相比 于现有技术中的字符串匹配、混淆规则批改、深度学习粗粒度批改,本发明的试卷批改方法 能够更灵活,细粒度地批改,同时解决了一题多个子答案的问题,批改准确率有了很大提 高,提升了批改的效率和学科灵活性。 另外,根据本发明提供的上述技术方案中的试卷批改方法,还可以具有如下附加 4 CN 111597908 A 说 明 书 2/8 页 技术特征: 在上述技术方案中,进一步地,根据答题区域规则和试题图像,确定答题区域图 像,具体包括:对试题图像进行投影变换处理;根据答题区域规则确定试题图像的答题区 域;根据答题区域切割试题图像,得到答题区域图像。 在该技术方案中,通过基于连通域和投影变换,找出手写答案所包含的手写文字 区域,结合直线等答题区域规则的起始位置,定位到答题区域,并通过子图切割方法,从每 一题的试题图像中切割出答题区域图像。从而能够在无需扫描空白试卷模板的情况下,通 过图像处理的方法定位到题目中的答题区域,优化电子版纸质试卷的批改方式。 在上述任一技术方案中,进一步地,获取试题图像,具体包括:获取试卷图像;分析 试卷图像的版面信息;根据版面信息切割试卷图像,得到至少一个试题图像,并生成试题图 像的第一编码信息。 在该技术方案中,获取考生答复的纸质试卷图像,对试卷图像进行版面分析,以确 定题目的类型和位置,并根据版面信息切割试卷图像,形成每一道目的试题图像,同时生成 每一个试题图像唯一的第一编码信息,以便于将试题图像中的答题文本信息与标准答案进 行比对,解决了一题多个子答案的问题,有效提升批改准确率。 具体地,在获得试卷图像后,对图像进行角度纠正预处理,能够使得图片中,试题 的内容处于正常的位置,进而能够便于对待拆分试卷图像的识别。 在上述任一技术方案中,进一步地,根据答题区域规则和试题图像,确定答题区域 图像之后,还包括:生成与第一编码信息对应答题区域图像的第二编码信息。 在该技术方案中,根据答题区域生成与第一编码信息对应答题区域图像的第二编 码信息,使得识别出的答题文本信息能够与每一道题目进行关联,对于同一题中同义的子 答案,能够很好的区分,以便于将试题图像中的答题文本信息与标准答案进行比对,从而解 决了一题多个子答案的问题,有效提升批改准确率。 在上述任一技术方案中,进一步地,比对答题文本信息和标准答案信息,具体包 括:获取标准答案信息,并确定第一编码信息和标准答案信息的第三编码信息之间的对应 关系;根据标准答案信息和批改混淆规则构建知识库;根据第一编码信息和第二编码信息 之间的对应关系、第一编码信息和第三编码信息之间的对应关系、字符串匹配算法,匹配答 题文本信息和知识库。 在该技术方案中,获取标准答案信息,并确定第一编码信息和标准答案信息的第 三编码信息之间的对应关系,以将每个题目和相应答案一一对应或者一对多对应,然后按 照第一编码信息和第三编码信息之间的对应关系将标准答案和对应的题目按照每个学科 的批改混淆规则用知识库来存储表示,通过字符串匹配算法比对答题文本信息和对应的标 准答案信息,具体地,采用字典树和KMP(Knuth–Morris–Pratt  algorithm,分析模式字符 串)算法,一方面,实现纸质试卷客观题的智能化批改,减少了人工评阅的工作量,提高了试 卷批改效率和正确率。另一方面,相比于现有技术中的字符串匹配、混淆规则批改、深度学 习粗粒度批改方法,无需大量的样本集训练,对不同类型的客观题题目也没有很好的兼容 性,能够细粒度排查错误原因,同时提高了批改的效率和学科灵活性。 在上述任一技术方案中,进一步地,识别答题区域图像中的答题文本信息之后,还 包括:根据语义词典和/或上下文语言模型,确定答题文本信息的错误概率;将错误概率大 5 CN 111597908 A 说 明 书 3/8 页 于预设阈值的答题文本信息作为错误文本;筛选相似文本数据库中与错误文本对应的相似 文本;根据相似文本替换错误文本。 在该技术方案中,考虑了中文字符在词法的特点和中文句法语义的上下文关系等 显著特征,结合语义词典和上下文的语言模型进一步地在答题文本信息中检测出识别错误 区域,并确定识别错误区域内字与字之间的错误概率,将错误概率较高的文本作为错误文 本,并确定错误文本对应的相似文本数据库,将相似文本数据库内的文字带入到答题文本 信息计算匹配得分,将匹配得分最高的文本作为相似文本,即纠错结果,将该相似文本与错 误文本进行替换,完成纠错。从而实现文本识别的自动纠错功能,能够降低了识别过程中人 工标注的成本,在加快了识别速度的同时提升了识别的准确率。其中,计算错误文本与汉字 库中文本的相似度得分,根据相似度得分大于相似阈值的文本和历史纠错结果构建该错误 文本的相似文本数据库,实现相似文本的精准筛选。 在上述任一技术方案中,进一步地,根据相似文本替换错误文本之后,还包括:输 出替换后的答题文本信息和对应的答题区域图像;根据反馈的修正信息,对答题文本信息 进行修正和补充。 在该技术方案中,在确实能够识别出的答题文本信息出现错误后,输出替换后的 答题文本信息和对应的答题区域图像,以供人工核验,根据反馈的修正信息,对答题文本信 息进行修正和补充,使得用户能够对纠错后的答题文本信息进行进一步修正,增加人工干 预批改功能,进一步提升识别的准确度,保证了试卷批改的准确性。 在上述任一技术方案中,进一步地,获取试题图像和答题区域规则之后,还包括: 对试题图像进行图像预处理,其中,图像预处理包括以下至少一种:去噪处理,灰度处理,二 值化处理,图像开运算,膨胀处理。 在该技术方案中,通过图像预处理能够使得图片质量变得干净凸显出试题图像中 的内容,有利于分析答题区域,方便后续的操作,从而提升了答题文本信息识别的效率。 在上述任一技术方案中,进一步地,识别答题区域图像中的答题文本信息,具体包 括:对答题区域图像进行滤波处理和/或线条去除处理;根据OCR文字识别模型识别答题区 域图像中的答题文本信息。 在该技术方案中,部分答题区域图片中存在下划线或者括号,考虑到这些线条可 能会影响后续的文字识别效果,所以首先去除这些线条,在根据OCR(Optical  Character  Recognition,光学字符识别)图像识别技术将图像格式的答题笔迹信息转化成“电子版”机 打文字格式的答题文本信息,从而提高识别精度、降低误识几率,提高批改客观题的效率。 具体地,预先根据教育领域语料,用CRNN attention模型来搭建OCR识别模型,对 于一些公式之类的特殊字符,可以转换成latex格式来表示。 根据本发明的第二方面,提出了一种试卷批改装置,包括存储器、处理器,存储器 储存有计算机程序,处理器执行计算机程序时实现上述任一项的试卷批改方法。因此该试 卷批改装置具备上述任一项的试卷批改方法的全部有益效果。 本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践 了解到。 6 CN 111597908 A 说 明 书 4/8 页 附图说明 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得 明显和容易理解,其中: 图1示出了本发明一个实施例的试卷批改方法流程示意图; 图2示出了本发明又一个实施例的试卷批改方法流程示意图; 图3示出了本发明又一个实施例的试卷批改方法流程示意图; 图4示出了本发明又一个实施例的试卷批改方法流程示意图; 图5示出了本发明又一个实施例的试卷批改方法流程示意图; 图6示出了本发明又一个实施例的试卷批改方法流程示意图; 图7示出了本发明具体一个实施例的填空题的智能批改方法流程示意图; 图8示出了本发明一个实施例的试卷批改装置示意框图。
下载此资料需消耗2积分,
分享到:
收藏