logo好方法网

一种构建知识图谱的方法

技术摘要:
本发明涉及一种构建知识图谱的方法,构建知识图谱的方法包括以下步骤,初步列出本行业的技术领域,查询所建行业的相关资料,并对资料分类归纳;确定业务类别,根据查询资料,确定行业的业务类别名称;初步筛选业务类别并建立归属关系示意图;确定关键词;业务关系文本  全部
背景技术:
知识图谱,也被称为科学知识图谱,在图书情报界称为知识域可视化或知识领域 映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述 知识资源及其载体,挖掘、分析、构建、绘制和显示知识及知识之间的相互关系。 基于知识图谱的大数据分析,实现了大数据的本质语义关联,比传统的关系型数 据库更加自由多样化,能够更好地满足用户对大数据金矿的价值探索和情报发现需求。 开放通用知识图谱注重广度,强调融合更多的实体,其准确性不高,并且受概念范 围的影响很难借助本体库覆盖特定行业垂直领域的实体、属性、实体间的关系等。 关于知识图谱的研究成果,已经有一些,如申请公布号CN110297872A的发明专利 公开了一种科技领域知识图谱的构建、查询方法及系统。所述科技领域知识图谱的构建、查 询方法支持用户自定义对象、关系、属性,可在应用场景变化的情况下灵活扩展;支持建立 数据表到对象、关系的映射,以及字段到属性的映射,通过ApacheNifi抽取关系数据库中数 据转换为对象、属性、关系实例数据存储到图数据库中,支持数据的增量更新;有效的解决 了当前通用知识图谱构建方法应用到特定行业存在的概念、准确性等弊端。 授权公告号CN103488724B的发明专利公开了一种面向图书的阅读领域知识图谱 构建方法,针对当前电子阅读存在知识层次浅、知识推荐不够智能等问题,提出一种结合通 用知识图谱,构造面向图书的领域知识图谱的方法,为电子书籍构造知识网络,从而实现对 书籍词语的解释和智能的知识推荐。
技术实现要素:
本发明的目的是提供一种构建知识图谱的方法,以提高知识图谱的准确性,提高 其应用价值。 为实现上述目的,本发明采用如下技术方案: 一种构建知识图谱的方法,包括以下步骤,(1)、初步列出本行业的技术领域,查询 所建行业的相关资料,并对资料分类归纳; (2)、确定业务类别,根据查询资料,确定行业的业务类别名称; (3)、初步筛选业务类别并建立归属关系示意图; (4)、确定关键词; (5)、业务关系文本化; (6)、征询行业专家意见并修改完成; (7)、确定最终版,并生成可导入的知识图谱格式。 进一步地,步骤(1)中,列出本行业技术领域,可以采用方法(1-1)、行业国标分类, 根据国家统计局国民经济行业分类及可参考的行业分类文献,得到行业技术领域;或者(1- 3 CN 111581398 A 说 明 书 2/5 页 2)、行业内部分类,寻找行业专家或行业从业人员参与本行业技术领域构建工作;或者(1- 3)、总结资料分类,通过百度百科、维基百科、百度搜索途径获取行业业务信息,并总结出技 术领域。 进一步地,步骤(2)中,确定业务类别可以采用,方法(2-1)、根据行业国标分类,结 合知识图谱的需要,选择所需的业务类别;或者(2-2)、根据行业内部分类,直接获取知识图 谱所需的业务类别;或者(2-3)、通过网上查询行业资料,总结出一个相对粗糙的业务类别。 进一步地,步骤(3)中,根据确定的业务类别名称建立归属关系示意图,在该过程 中,删除或新增业务类别,完成归属关系示意图的建立。 进一步地,步骤(4),具体包括(4-1)、搜索关键词,通过网上查询本行业的相关业 务,获取对应的技术领域关键词; (4-2)、校验关键词,通过咨询行业专家和从事本行业的从业人员提供一份权威的 关键词或搜集本行业的公告标题整理出一份关键词,再依据该份关键词对网上查询的关键 词进行筛选、校验; (4-3)、分词,对校验后的关键词做最小化的分词拆分,以两个字的词语为最小,专 有名词除外。 进一步地,步骤(5)中,业务关系文本化,是对归属关系最后确认,以方便生成可导 入的知识图谱业务关系文档。 进一步地,步骤(6)中,业专家提出意见并修改,该步骤可重复若干次,以得到最佳 的知识图谱。 本发明的有益效果: 执行本发明的各步骤,可以建立某一行业的知识图谱,降低了知识图谱的构建难 度,从而降低了成本,提高构建效率;构建过程中,经过多次征询专家意见并修改确定,进一 步提高了准确率,具有很好的推广价值。
下载此资料需消耗2积分,
分享到:
收藏