logo好方法网

一种基于ICD9-CM-3的手术知识图谱构建方法和装置


技术摘要:
本发明提出了一种基于ICD9‑CM‑3的手术知识图谱构建方法和装置,方法包括:步骤1、对ICD‑9‑CM‑3官方和全国所有扩展版手术概念进行融合,获得融合信息,建手术概念间关系的指导编码;步骤2、基于指导编码构建手术概念之间的关系,若手术概念对应的编码间具有蕴含关  全部
背景技术:
现有医学知识图谱的一种构建方法是从医学资料(如病历)中利用自然语言处理 技术抽取医学实体(如疾病、症状、检查),然后通过计算实体间的相关度构建医学实体间的 相关关系,最后将医学实体和相关关系导入图数据库中。从病历中采用传统机器学习的方 法挖掘医疗实体和关系,没有尝试从官方公开的权威的手术术语集抽取和融合医疗的实体 和关系。没有涉及对实体属性的定义和抽取。
技术实现要素:
本发明提供了一种基于ICD9-CM-3的手术知识图谱构建方法和装置,用以解决现 有的方法构建的图谱存在准确率较低的问题,所采取的技术方案如下: 一种基于ICD9-CM-3的手术知识图谱构建方法,所述手术知识图谱构建方法的过 程包括:首先,利用ICD-9-CM-3官方和全国所有扩展版手术概念构建手术概念关系的指导 编码,并利用所述指导编码构建手术概念之间的关系和蕴涵关系;然后,根据手术概念和属 性值定义手术的概念属性,并利用Bert BiLSTM CRF模型对手术概念进行识别获得概念属 性;最后,建立所述概念属性与手术概念的属性关系,并利用属性关系和蕴涵关系形成手术 知识图谱。 进一步地,手术知识图谱构建方法的具体过程包括: 步骤1、对ICD-9-CM-3官方和全国所有扩展版手术概念进行融合,获得包含ICD-9- CM-3官方和全国所有扩展版手术概念的融合信息,根据所述融合信息构建手术概念间关系 的指导编码; 步骤2、基于步骤1获得的指导编码构建手术概念之间的关系,若手术概念对应的 编码间具有蕴含关系,则根据编码蕴含关系构建手术之间的蕴含关系; 步骤3、根据手术概念和属性值定义手术的概念属性; 步骤4:使用Bert BiLSTM CRF模型对手术概念进行命名实体识别,识别出步骤3中 定义的概念属性; 步骤5:抽取步骤4中识别出来的概念属性,在所述概念属性与其对应的手术概念 之间建立属性关系; 步骤6:将所述属性关系和蕴含关系填充至图数据库中形成手术知识图谱。 进一步地,步骤1构建所述指导编码的过程包括: 步骤11、判断所述融合信息中的手术概念中,是否存在多个手术概念的编码格式 全部为扩展编码,如果不存在,针对融合信息中编码格式中含有相同粗粒度的手术概念,提 取手术概念的粗粒度的编码作为指导编码;如果存在,则跳转至步骤12; 4 CN 111599479 A 说 明 书 2/8 页 步骤12、针对编码格式全部为扩展编码的多个手术概念,选择所述多个手术概念 中的一个作为主版本,作为主版本的手术概念对应的编码作为指导编码; 步骤13、判断作为主版本的手术概念以外的手术概念的扩展编码中是否含有主版 本的编码中不存在的编码和概念,如果存在,则将编码中包含主版本不存在的编码的所述 手术概念对应的所有版本扩展编码切分出上一级的编码,按照上一级编码出现的次数投 票,选择最多的一个编码对应的扩展编码作为指导编码。 进一步地,所述Bert BiLSTM CRF模型中的Bert医疗语料的基础上采用自监督的 方法为词语学习特征表示,CRF通过转移特征约束BiLSTM输出标签的顺序性。 一种上述任一所述方法对应的手术知识图谱构建装置,所述手术知识图谱构建装 置包括: 所述信息融合模块,用于将ICD-9-CM-3官方和全国所有扩展版手术概念进行融 合,获得包含ICD-9-CM-3官方和全国所有扩展版手术概念的融合信息; 所述关系和编码构建模块块,用于构建手术概念间关系的指导编码、手术概念之 间的关系和蕴含关系; 所述概念属性定义模块,用于根据手术概念和属性值定义手术的概念属性; 所述Bert BiLSTM CRF模型,用于对手术概念进行命名实体识别,识别出手术概念 对应的概念属性; 所述属性关系建立模块,用于抽取所述Bert BiLSTM CRF模型识别出来的概念属 性,在所述概念属性与其对应的手术概念之间建立属性关系; 所述导入模块,用于将所述属性关系和蕴含关系填充至图数据库中形成手术知识 图谱。 进一步地,所述关系和编码构建模块块包括: 所述指导编码建立模块,用于根据所述融合信息构建手术概念间关系的指导编 码; 所述关系建立模块,用于根据指导编码构建手术概念之间的关系,并判断手术概 念对应的编码之间是否存在蕴含关系,若手术概念对应的编码间具有蕴含关系,则根据编 码蕴含关系构建手术之间的蕴含关系; 进一步地,所述指导编码建立模块包括: 编码格式判断模块,用于判断所述融合信息中的手术概念中,是否存在多个手术 概念的编码格式全部为扩展编码,如果不存在,则启动粗粒度指导编码建立模块;如果存 在,则启动主版本方式指导编码建立模块; 粗粒度方式指导编码建立模块,用于针对融合信息中编码格式中含有相同粗粒度 的手术概念,提取手术概念的粗粒度的编码作为指导编码; 主版本方式指导编码建立模块,用于针对编码格式全部为扩展编码的多个手术概 念,选择所述多个手术概念中的一个作为主版本,作为主版本的手术概念对应的编码作为 指导编码; 扩展码方式指导编码建立模块,用于判断作为主版本的手术概念以外的手术概念 的扩展编码中是否含有主版本的编码中不存在的编码和概念,如果存在,则将编码中包含 主版本不存在的编码的所述手术概念对应的所有版本扩展编码切分出上一级的编码,按照 5 CN 111599479 A 说 明 书 3/8 页 上一级编码出现的次数投票,选择最多的一个编码对应的扩展编码作为指导编码。 进一步地,所述Bert BiLSTM CRF模型中的Bert医疗语料的基础上采用自监督的 方法为词语学习特征表示,CRF通过转移特征约束BiLSTM输出标签的顺序性。 本发明有益效果: 本发明提出的手术知识图谱构建方法和装置,基于权威的ICD-9-CM-3官方以及全 国各地扩展版本而建立手术知识图谱,通过上述方法构建出来的手术知识图谱的手术概念 和关系的准确率更高。 附图说明 图1为发明所述手术知识图谱构建方法的流程图; 图2为发明所述手术知识图谱构建装置的结构示意图; 图3为发明所述手术知识图谱构建装置的原理示意图。
分享到:
收藏