
技术摘要:
本发明实施例涉及题目收集技术领域,公开了一种题目匹配的方法和系统。该方法包括:智能终端获取目标页面图像并发送给服务器;服务器识别目标页面图像中页眉部分和页脚部分,并根据页眉部分和页脚部分确定搜索关键词;服务器利用搜索关键词遍历索引集合,确定目标索引 全部
背景技术:
为了解决中小学的作业难题,目前,市场上出现了很多解决学生作业难题的搜题 或错题汇总类应用程序,这些应用程序都是通过摄像头拍摄题目图片,然后通过裁剪和框 选等方式得到框题内容,进而用于错题保存或用来搜索对应的答案。 因为框题内容为图片,用于错题保存,在打印重做时,因为摄像头像素以及其他原 因,可能会导致打印不清晰。用于搜索答案时,需要字符识别找到该题目对应的答案,过程 繁琐的同时,如果框题内容不清楚,很可能使得搜索失败或搜索到其他题的答案。
技术实现要素:
针对所述缺陷,本发明实施例公开了一种题目匹配的方法和系统,通过语音获得 待收集题目的图片,操作简单,效率高。 本发明实施例第一方面公开一种题目匹配的方法,应用于智能终端中,所述方法 包括: 智能终端获取目标页面图像,并将所述目标页面图像发送给服务器; 服务器识别所述目标页面图像中页眉部分和页脚部分,并根据所述页眉部分和页 脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二条件;所述第一 条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种或多种; 服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词 相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源; 服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目 资源的关系页面; 智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器; 所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取 与所述框题区域位置相同的内容作为框题内容。 作为一种可选的实施方式,在本发明实施例第一方面中,所述根据所述页眉部分 和页脚部分确定搜索关键词,包括: 识别所述页眉部分或/和页脚部分中的字符,从所述字符中筛选年级和科目,作为 第一条件; 检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书名以及品牌名中 的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种作为第二条件; 检测所述页眉部分或/和页脚部分中的非字符部分中是否包括出版社以及品牌名 中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种作为第二条件; 在存在第二条件时,将第一条件和第二条件作为搜索关键词。 6 CN 111553366 A 说 明 书 2/14 页 作为一种可选的实施方式,在本发明实施例第一方面中,服务器利用所述搜索关 键词遍历题目资源库的索引集合,确定与所述搜索关键词相同的目标索引,并根据所述目 标索引获取题目资源库中对应的目标题目资源,包括: 利用所述搜索关键词遍历题目资源库的索引集合; 将所述题目资源库的索引集合中包含搜索关键词所有信息的索引作为目标索引; 根据所述目标索引以及映射关系获取题目资源库中的目标题目资源。 作为一种可选的实施方式,在本发明实施例第一方面中,所述智能终端接收用户 在承载体上的操作轨迹,之前,还包括: 服务器识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页 面中相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关 系页面对应的目标题目资源为目标页面图像对应的匹配资源; 所述在所述关系页面中获取与所述框题区域位置相同的内容作为框题内容,包 括: 在所述匹配资源的关系页面中获取与所述框题区域位置相同的内容作为框题内 容。 作为一种可选的实施方式,在本发明实施例第一方面中,所述智能终端获取目标 页面图像,包括: 接收用户发送的触发指令,智能终端根据所述触发指令启动摄像头对承载体进行 拍照,获取目标页面图像。 作为一种可选的实施方式,在本发明实施例第一方面中,所述服务器根据所述操 作轨迹和预设规则确定框题区域,包括: 服务器将在承载体上的操作轨迹通过坐标转换到在目标页面图像中上,得到在目 标页面图像上的运行轨迹; 服务器根据所述运行轨迹以及预设规则确定对目标页面图像的框题区域。 作为一种可选的实施方式,在本发明实施例第一方面中,在所述关系页面中获取 与所述框题区域位置相同的内容作为框题内容,包括: 获取关系页面对应的所有标识,从所述所有标识中选择所述框题区域对应位置的 目标标识; 根据所述目标标识和映射关系获取关系页面中所述目标标识对应的内容; 将所述目标标识对应的内容作为框题内容。 本发明实施例第二方面公开一种题目匹配的系统,其包括智能终端和服务器; 所述智能终端,包括: 第一获取单元,用于获取目标页面图像,并将所述目标页面图像发送给服务器; 接收单元,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务 器; 所述服务器,包括: 第一识别单元,用于识别所述目标页面图像中页眉部分和页脚部分,并根据所述 页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或者第一条件和第二 条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本号和品牌名的一种 7 CN 111553366 A 说 明 书 3/14 页 或多种; 搜索单元,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜 索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源; 第二识别单元,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码 获取目标题目资源的关系页面; 第二获取单元,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页 面中获取与所述框题区域位置相同的内容作为框题内容。 作为一种可选的实施方式,在本发明实施例第二方面中,所述第一识别单元,包 括: 第一筛选子单元,用于识别所述页眉部分或/和页脚部分中的字符,从所述字符中 筛选年级和科目,作为第一条件; 第二筛选子单元,检测所述页眉部分或/和页脚部分中的字符是否包括版本号、书 名以及品牌名中的一种或多种,如果包括,将所述版本号、书名以及品牌名中的一种或多种 作为第二条件; 第三筛选子单元,检测所述页眉部分或/和页脚部分中的非字符部分中是否包括 出版社以及品牌名中的一种或多种,如果包括,将所述出版社以及品牌名中的一种或多种 作为第二条件; 判断子单元,用于在存在第二条件时,将第一条件和第二条件作为搜索关键词。 作为一种可选的实施方式,在本发明实施例第二方面中,所述搜索单元,包括: 查询子单元,用于利用所述搜索关键词遍历题目资源库的索引集合; 第一确定子单元,用于将所述题目资源库的索引集合中包含搜索关键词所有信息 的索引作为目标索引; 映射子单元,用于根据所述目标索引以及映射关系获取题目资源库中的目标题目 资源。 作为一种可选的实施方式,在本发明实施例第二方面中,所述服务器还包括匹配 单元,用于识别所述目标页面图像正文任意一个或多个位置的字符,并与所述关系页面中 相同位置的字符进行相似度比对;在所述相似度比对大于或等于第一阈值时,所述关系页 面对应的目标题目资源为目标页面图像对应的匹配资源。 作为一种可选的实施方式,在本发明实施例第二方面中,所述第一获取单元包括: 拍照子单元,用于接收用户发送的触发指令,并根据所述触发指令启动摄像头对承载体进 行拍照,获取目标页面图像。 作为一种可选的实施方式,在本发明实施例第二方面中,所述第二获取单元,包 括: 转换子单元,用于将在承载体上的操作轨迹通过坐标转换到在目标页面图像中 上,得到在目标页面图像上的运行轨迹; 第二确定子单元,用于根据所述运行轨迹以及预设规则确定对目标页面图像的框 题区域。 作为一种可选的实施方式,在本发明实施例第二方面中,所述第二获取单元,还包 括: 8 CN 111553366 A 说 明 书 4/14 页 选择子单元,用于获取关系页面对应的所有标识,从所述所有标识中选择所述框 题区域对应位置的目标标识; 第二映射子单元,用于根据所述目标标识和映射关系获取关系页面中所述目标标 识对应的内容; 第三确定子单元,用于将所述目标标识对应的内容作为框题内容。 本发明实施例第三方面公开一种题目匹配的方法,所述方法包括: 智能终端获取目标页面图像,并将所述目标页面图像发送给服务器; 服务器识别所述目标页面图像中页眉部分和页脚部分,并将所述页眉部分和页脚 部分均与题目资源库中存储的页眉页脚检测图像进行比对,所述页眉页脚检测图像与题目 资源库中的题目资源一一对应; 如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对大于或等于第 二阈值,服务器将页眉页脚检测图像对应的题目资源作为目标题目资源; 如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度比对小于第二阈值 时,服务器根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为第一条件,或 者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、出版社、版本 号和品牌名的一种或多种; 服务器利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜索关键词 相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源; 服务器从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取目标题目 资源的关系页面; 智能终端接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务器; 所述服务器根据所述操作轨迹和预设规则确定框题区域,在所述关系页面中获取 与所述框题区域位置相同的内容作为框题内容。 本发明实施例第四方面公开一种题目匹配的系统,包括智能终端和服务器; 所述智能终端,包括: 第一获取单元,用于获取目标页面图像,并将所述目标页面图像发送给服务器; 接收单元,用于接收用户在承载体上的操作轨迹,并将所述操作轨迹发送给服务 器; 所述服务器,包括: 比对单元,用于识别所述目标页面图像中页眉部分和页脚部分,并将所述页眉部 分和页脚部分均与题目资源库中存储的页眉页脚检测图像进行比对,所述页眉页脚检测图 像与题目资源库中的题目资源一一对应; 第一判断单元,用于如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度 比对大于或等于第二阈值,将页眉页脚检测图像对应的题目资源作为目标题目资源; 第二判断单元,用于如果所述页眉部分和页脚部分与页眉页脚检测图像的相似度 比对小于第二阈值时,根据所述页眉部分和页脚部分确定搜索关键词,所述搜索关键词为 第一条件,或者第一条件和第二条件;所述第一条件为年级和科目,所述第二条件为书名、 出版社、版本号和品牌名的一种或多种; 搜索单元,用于利用所述搜索关键词遍历题目资源库的索引集合,确定与所述搜 9 CN 111553366 A 说 明 书 5/14 页 索关键词相同的目标索引,并根据所述目标索引获取题目资源库中对应的目标题目资源; 识别单元,用于从所述页眉部分或页脚部分中识别出页码,并根据所述页码获取 目标题目资源的关系页面; 第二获取单元,用于根据所述操作轨迹和预设规则确定框题区域,在所述关系页 面中获取与所述框题区域位置相同的内容作为框题内容。 本发明实施例第五方面公开一种智能终端,包括: 存储有可执行程序代码的存储器; 与所述存储器耦合的处理器; 所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第 一方面或第三方面公开的智能终端执行的部分或全部步骤。 本发明实施例第六方面公开一种服务器,包括: 存储有可执行程序代码的存储器; 与所述存储器耦合的处理器; 所述处理器调用所述存储器中存储的所述可执行程序代码,执行本发明实施例第 一方面或第三方面公开的服务器执行的部分或全部步骤。 本发明实施例第七方面公开一种计算机可读存储介质,所述计算机可读存储介质 存储了程序代码,其中,所述程序代码包括用于执行本发明实施例第一方面或第三方面公 开的任意一种方法的部分或全部步骤的指令。 本发明实施例第八方面公开一种计算机程序产品,当所述计算机程序产品在计算 机上运行时,使得所述计算机执行本发明实施例第一方面或第三方面公开的任意一种方法 的部分或全部步骤。 本发明实施例第九方面公开一种应用发布平台,所述应用发布平台用于发布所述 计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本 发明实施例第一方面或第三方面公开的任意一种方法的部分或全部步骤。 与现有技术相比,本发明实施例具有以下有益效果: 本发明实施例中,通过页眉页脚信息识别题目资源库中相关的目标题目资源。可 见,实施本发明实施例,可以得到更为清晰的框题内容图片或字符文本,可保证后续错题收 集的清晰度或搜索答案的准确性。 附图说明 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的 附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领 域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附 图。 图1是本发明实施例公开的一种题目匹配的方法的流程示意图; 图2是本发明实施例公开的一种练习册的页面结构图; 图3是本发明实施例公开的另一种练习册的页面结构图; 图4是本发明实施例公开的又一种练习册的页面结构图; 图5是本发明实施例公开的另一种题目匹配的方法的流程示意图; 10 CN 111553366 A 说 明 书 6/14 页 图6是本发明实施例公开的一种题目匹配的系统的结构示意图; 图7是本发明实施例公开的另一种题目匹配的系统的结构示意图; 图8是本发明实施例公开的一种智能终端的结构示意图; 图9是本发明实施例公开的一种服务器的结构示意图。