logo好方法网

智能化教育知识图谱构建系统与方法


技术摘要:
本发明提供了智能化教育知识图谱构建系统与方法,该智能化教育知识图谱构建系统与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行  全部
背景技术:
智能化教育技术已经广泛应用于不同模式的知识教授和课程学习中,智能化教育 能够帮助老师或者学生实现有针对性的和精准的教育知识数据加工以及高效的知识教授 与学习。但是,在知识教育领域,相关的知识教育数据的数据量是巨大的并且数据结构较为 复杂,为了提高教育知识学习的全面性,需要对教育知识数据进行准确的挖掘与关联,以此 构建相应的教育知识图谱。但是,现有技术构建教育知识图谱的方式都只是局限于教育知 识数据本身的文本属性,其并未针对不同教育知识数据之间的关联性进行构建,这不利于 提高教育知识图谱的数据可溯性和数据可靠性。
技术实现要素:
针对现有技术存在的缺陷,本发明提供智能化教育知识图谱构建系统与方法,该 智能化教育知识图谱构建系统与方法通过对关于某一学科的教育知识点数据进行关于知 识点内容的分类后,进行可识别文本转换处理和规范化处理,以此生成知识文本集合,并且 还确定该知识点文本集合中不同文本元之间的实体关联性,最后再根据该实体关联性,对 该知识点文本集合中的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一 学科的教育知识图谱;可见,该智能化教育知识图谱构建系统与方法不仅能够对教育知识 点数据本身进行有针对性的文本转换和纠错规范,以此提高该教育知识点数据的准确性和 可靠性,并且还能够以文本元的形式对不同教育知识点数据之间的实体关联性进行有效地 挖掘,以使构建得到的教育知识图谱更能够真实地和全面地反映不同教育知识点数据在知 识层面上的关系,从而提高教育知识图谱的数据可溯性和数据可靠性。 本发明提供智能化教育知识图谱构建系统,其特征在于: 所述智能化教育知识图谱构建系统包括教育知识点数据分类模块、知识文本集合 生成模块、文本元实体关联系确定模块和教育知识图谱构建模块;其中, 所述教育知识点数据分类模块用于对来自预设教育资源库的某一学科的教育知 识点数据进行关于知识点内容的分类; 所述知识文本集合生成模块用于对所述分类后的不同教育知识点数据进行可识 别文本转换处理和规范化处理,以此生成知识文本集合; 所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文本元之 间的实体关联性; 所述教育知识图谱构建模块用于根据所述实体关联性,对所述知识点文本集合中 的所有文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图 谱; 6 CN 111597356 A 说 明 书 2/10 页 进一步,所述教育知识点数据分类模块包括教育知识点数据获取子模块、知识难 度值计算子模块和分类确定子模块;其中, 所述教育知识点数据获取子模块用于根据关于所述某一学科的教学课程框架,从 所述预设教育资源库中获取关于所述某一学科的所述教育知识点数据; 所述知识难度值计算子模块用于通过预设学科知识神经网络模型,计算每一项所 述教育知识点数据对应的知识内容难度值; 所述分类确定子模块用于根据所述知识内容难度值,将所有项教育知识点数据分 类为具有不同难度等级的教育知识点数据; 进一步,所述知识文本集合生成模块包括可识别文本转换处理子模块、规范化处 理子模块和知识文本集合组成子模块;其中, 所述可识别文本转换处理子模块用于对所述分类后的教育知识点数据进行关于 分词和/或短句的可识别文本转换处理,以此获得初始化知识文本; 所述规范化处理子模块用于对所述初始化知识文本进行语法规范化、逻辑规范化 和错别字规范化中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本; 所述知识文本集合组成子模块用于根据所述分类后的不同教育知识点数据各自 的难度等级,将所有规范化文本组成具有多维矩阵形式的知识文本集合; 进一步,所述文本元实体关联系确定模块包括文本元生成子模块和实体关联性评 价值计算子模块;其中, 所述文本元生成子模块用于根据所述知识点文本集合中的每一项知识点文本的 文本语料和文本结构,将每一项知识点文本转换为相应的文本元; 所述实体关联性评价值计算子模块用于通过知识点文本实体关联性评价神经网 络模型对所有文本元进行分析处理,以此计算不同文本元相互之间在文本实体语料和/或 文本实体结构上的实体关联性评价值; 进一步,所述教育知识图谱构建模块包括重组排列子模块、索引标注子模块和图 谱转化处理子模块;其中, 所述重组排列子模块用于根据所述实体关联性对应的实体关联性评价值,对所述 知识点文本集合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低 实体关联性表征状态的文本元结构树; 所述索引标注子模块用于对所述文本元结构树上的每一个文本元进行关于文本 语义和/或文本查询路径的索引标注,以此获得索引标注化文本元结构树; 所述图谱转化处理子模块用于将所述索引标注化文本元结构树进行二维图谱的 转化处理,以此构建形成关于所述某一学科的教育知识图谱; 进一步,所述文本元实体关联系确定模块用于确定所述知识点文本集合中不同文 本元之间的实体关联性,其具体实现过程如下: 步骤A1,根据所述教育知识点数据获取子模块获取所述某一学科的所述教育知识 点数据,通过预设学科知识神经网络模型以及下面公式(1),获取每一项所述教育知识点数 据对应的知识内容难度值 7 CN 111597356 A 说 明 书 3/10 页 在上述公式(1)中,P为所述各学科所含教育知识点数据的数量,p=1,2,3、、、P;k 为所述知识点数据难度等级,其取值范围为[0,22],dk为所述知识点数据难度等级为k所对 应知识点数据复杂语法结构数量,ok为所述知识点数据难度等级为k所对应知识点数据复 杂文本结构数量, 为各项所述教育知识点数据中既有复杂语法结构及复杂文本结构的语 句数量,j为知识点数据在考核中分数占比,wj为知识点数据在考核中分数占比为j所对应 的重要知识点排序,f(ok,d)为根据各知识点数据的复杂语法结构和文本结构数量判断知 识点的难易度,其判断阈值为0.6,即当知识点数据的复杂语法结构和文本结构数量超过总 知识的0.6时,判断为较难知识点,反之,则为较易知识点,f(wj,k)为根据知识点数据在考 核中分数占比判断是否为重要知识点,其判断阈值为0.3,即考核中该知识点数据分数占比 超过总分数的0.3,则判断为重要知识点,P(wj,dk,ok)为获取每一项所述教育知识点数据对 应的知识内容难度值; 步骤A2,根据步骤A1获取的每一项所述教育知识点数据对应的知识内容难度值以 及下面公式(2),进行数据关联组合,获取多维矩阵形式的知识文本集合 在上述公式(2)中,Π为连乘,M为所述待组成具有多维矩阵形式的知识文本子集 数量,i为所述各项教育知识点数据中所含单词数量,ai为所述各项教育知识点数据中所含 单词数量为i所对应的词组/短句总数,l为根据首字母进行组合的子集数量,bl为根据首字 母进行组合的子集数量为l所对应各子集索引标注信息, 为所述知识文本重组排列的次 数,γ为将各文本词组按照首字母、次字母顺序进行多维矩阵排序,F(ai,bl)为获取多维矩 阵形式的知识文本集合; 步骤A3,将步骤A2获取的多维矩阵形式的知识文本集合,通过所述知识点文本实 体关联性评价神经网络模型对所有文本元以及下面公式(3)进行分析处理,根据评判结果, 执行获得不同文本元相互之间在文本实体语料或文本实体结构上的实体关联性评价值的 操作 在上述公式(3)中,N为所述文本元的总数,取值应大于2,h为随机两份文本元之间 的相同文本实体文字占比,x为随机两份文本元之间相同文本实体语料占比, 为根据语 言数据库随机匹配检索各不同文本元之间的词义相似度,g为随机两份文本元之间具有相 同文本实体结构数量,y为随机两份文本元之间在词义上属于包含关系的文本占比, 为 根据语言数据库随机匹配检索各不同文本元之间的关联度,f(a)为各文本元文本实体语料 信息,f(b)为各文本元文本实体结构信息,当P(h,l)计算值大于1时,则表示所述不同文本 元在文本实体语料或文本实体结构上存在一定关联,执行获得不同文本元相互之间在文本 8 CN 111597356 A 说 明 书 4/10 页 实体语料或文本实体结构上的实体关联性评价值的操作。 本发明还提供智能化教育知识图谱构建方法,其特征在于,所述智能化教育知识 图谱构建方法包括如下步骤: 步骤S1,从预设教育资源库中获取关于某一学科的教育知识点数据,并对所述教 育知识点数据进行关于知识点内容的分类; 步骤S2,对所述分类后的不同教育知识点数据进行可识别文本转换处理和规范化 处理,以此生成知识文本集合; 步骤S3,确定所述知识点文本集合中不同文本元之间的实体关联性; 步骤S4,根据所述实体关联性,对所述知识点文本集合中的所有文本元进行重组 排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱; 进一步,在所述步骤S1中,从预设教育资源库中获取关于某一学科的教育知识点 数据,并对所述教育知识点数据进行关于知识点内容的分类具体包括, 步骤S101,根据关于所述某一学科的教学课程框架,从所述预设教育资源库中获 取关于所述某一学科的所述教育知识点数据; 步骤S102,通过预设学科知识神经网络模型,计算每一项所述教育知识点数据对 应的知识内容难度值; 步骤S103,根据所述步骤S102计算得到的所述知识内容难度值,将所有项教育知 识点数据分类为具有不同难度等级的教育知识点数据; 或者, 在所述步骤S2中,对所述分类后的不同教育知识点数据进行可识别文本转换处理 和规范化处理,以此生成知识文本集合具体包括, 步骤S201,对所述分类后的教育知识点数据进行关于分词和/或短句的可识别文 本转换处理,以此获得初始化知识文本; 步骤S202,对所述初始化知识文本进行语法规范化、逻辑规范化和错别字规范化 中的至少一者处理,以此将所述初始化知识文本转换为规范化知识文本; 步骤S203,根据所述分类后的不同教育知识点数据各自的难度等级,将所有规范 化文本组成具有多维矩阵形式的知识文本集合; 进一步,在所述步骤S3中,确定所述知识点文本集合中不同文本元之间的实体关 联性具体包括, 步骤S301,根据所述知识点文本集合中的每一项知识点文本的文本语料和文本结 构,将每一项知识点文本转换为相应的文本元; 步骤S302,构建并优化一知识点文本实体关联性评价神经网络模型,并通过所述 知识点文本实体关联性评价神经网络模型对所有文本元进行分析处理,以此获得不同文本 元相互之间在文本实体语料和/或文本实体结构上的实体关联性评价值; 进一步,在所述步骤S4中,根据所述实体关联性,对所述知识点文本集合中的所有 文本元进行重组排列和索引标注,以此构建形成关于所述某一学科的教育知识图谱具体包 括, 步骤S401,根据所述实体关联性对应的实体关联性评价值,对所述知识点文本集 合中的所有文本元进行关于评价值高低的重组排列,以此生成具有不同高低实体关联性表 9 CN 111597356 A 说 明 书 5/10 页 征状态的文本元结构树; 步骤S402,对所述文本元结构树上的每一个文本元进行关于文本语义和/或文本 查询路径的索引标注,以此获得索引标注化文本元结构树; 步骤S403,将所述索引标注化文本元结构树进行二维图谱的转化处理,以此构建 形成关于所述某一学科的教育知识图谱。 相比于现有技术,该智能化教育知识图谱构建系统与方法通过对关于某一学科的 教育知识点数据进行关于知识点内容的分类后,进行可识别文本转换处理和规范化处理, 以此生成知识文本集合,并且还确定该知识点文本集合中不同文本元之间的实体关联性, 最后再根据该实体关联性,对该知识点文本集合中的所有文本元进行重组排列和索引标 注,以此构建形成关于所述某一学科的教育知识图谱;可见,该智能化教育知识图谱构建系 统与方法不仅能够对教育知识点数据本身进行有针对性的文本转换和纠错规范,以此提高 该教育知识点数据的准确性和可靠性,并且还能够以文本元的形式对不同教育知识点数据 之间的实体关联性进行有效地挖掘,以使构建得到的教育知识图谱更能够真实地和全面地 反映不同教育知识点数据在知识层面上的关系,从而提高教育知识图谱的数据可溯性和数 据可靠性。 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明 书、权利要求书、以及附图中所特别指出的结构来实现和获得。 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的附图。 图1为本发明提供的智能化教育知识图谱构建系统的结构示意图。 图2为本发明提供的智能化教育知识图谱构建方法的流程示意图。
分享到:
收藏