logo好方法网

一种基于浮动切割的肺结节深度学习分类方法


技术摘要:
本发明公开了一种基于浮动切割的肺结节深度学习分类方法,建立CT图像肺结节分类神经网络模型,设肺结节CT图像序列为沿Z轴方向切割肺结节得到的在X、Y轴的二维肺结节图像序列;设肺结节CT图像序列中包含肺结节三维中心位置的图像为中心图像;筛选已知结节分类的图像作为  全部
背景技术:
目前,由于空气污染加重、吸烟人口增加、生活节奏加快以及工作压力较大等,肺 癌已成为全球范围内发病率和死亡率最高的癌症之一。被诊断为肺癌的患者5年生存率仅 为15.6%,而被错误诊断进行切除手术会给患者身体造成额外负担,体质较弱患者甚至无 法承受手术过程,因此提高患者早期诊断准确率至关重要。由于早期肺结节体积较小难以 通过分辨率较低的胸片发现,因此目前肺部的疾病检测最常用的是计算机断层扫描 (Computed  Tomography,CT),医师通过观察肺部CT图像诊断患有肺部疾病。但是肺结节医 学特征绝大多数是通过临床统计归纳得到的,且由每位患者采集得到的CT图像有数百张, 导致在一定程度上存在着医师的主观因素且工作负荷大。 近年来在国内外开展了基于医学图像处理与模式识别的计算机辅助诊断 (computer  aided  diagnosis,CAD)方法的研究。通过CAD形成定量客观分析以此辅助医师 做出诊断决策,其可在一定程度上提高诊断正确率,但传统方法需要手动提取肺结节的纹 理特征或形状特征,虽然各特征值均有相应的定义但它们具有很强的主观性,仍然严重依 赖研究人员的经验。 自从Geoffrey  Hinton提出深度信念网络(deep  belief  network,DBN)以来,不需 要手动设置提取特征的深度学习方法引起了学术界的浪潮。有相当多学者研究深度学习方 法在肺结节良恶性分类的应用。有些方法使用CT序列中由医师选定的特定图像,有些方法 使用3D图像作为模型输入。前者方法中可能由于医师主观性或结节形状的不规则性,较难 确保选定图像中含有结节信息最多,且在图像序列中结节重要信息并不一定仅存在于一张 图像中。后者方法中模型输入是三维矩阵,因此模型需要训练的参数多,计算存储等资源消 耗较大。以及由于从患者采集并由医师准确标注了结节位置、长度、种类等信息的可使用图 像数量有限,较难满足深度学习模型在训练过程中需要大量样本的前提。 综上所述,如何使用有限的肺部CT图像样本对深度学习模型进行有效的训练,是 目前迫切需要解决的技术问题之一。
技术实现要素:
本发明为解决公知技术中存在的技术问题而提供一种提高预测精度的基于浮动 切割的肺结节深度学习分类方法。 本发明为解决公知技术中存在的技术问题所采取的技术方案是:一种基于浮动切 割的肺结节深度学习分类方法,建立CT图像肺结节分类神经网络模型,设肺结节CT图像序 列为沿Z轴方向切割肺结节得到的在X、Y轴的二维肺结节图像序列;设肺结节CT图像序列中 包含肺结节三维中心位置的图像为中心图像;收集多组已知结节分类的肺结节CT图像序 4 CN 111583179 A 说 明 书 2/7 页 列,并确定每组肺结节CT图像序列的中心图像及中心图像上的结节中心位置和结节长度, 将这些肺结节CT图像序列分成三部分,一部分作为训练样本集,一部分作为测试样本集,一 部分中的中心图像作为验证样本集;训练时,采用变动的切割间距对训练样本集中的肺结 节CT图像序列沿Z轴正负方向进行浮动切割,得到若干组动态训练样本序列;采用动态训练 样本序列对模型进行训练;每使用一组动态训练样本序列对模型进行训练后,采用验证样 本输入模型,对模型的性能进行初步评估;当初步评估的结果未达到设定指标时,则继续对 模型进行训练;当初步评估的结果达到设定指标时,采用测试样本序列对模型进行测试,对 模型的性能进行评估;当评估结果未达到设定指标时,则继续对模型进行训练及初步评估; 当评估结果达到设定指标时,结束训练。 进一步地,采用动态的切割间距对训练样本序列沿Z轴正负方向进行浮动切割时, 设置可浮动幅度对浮动切割层数进行限制,使浮动切割后每层图像均在结节区域内;可浮 动幅度由CT图像切割层间距、中心图像中的结节长度及控制因子确定,其中控制因子为限 制系数,取值范围为0.6~1;在模型训练中,对控制因子进行初始设定,根据模型测试结果, 逐步调节控制因子并确定。 进一步地,对CT图像肺结节分类神经网络模型进行训练及测试的方法包括如下步 骤: 步骤1,设定模型的性能指标及初始控制因子; 步骤2,确定可浮动幅度; 步骤3,在可浮动幅度内,随机选取切割间距对训练样本序列进行浮动切割,得到 动态训练样本序列; 步骤4,用一组动态训练样本序列对模型进行训练; 步骤5,将验证样本输入至训练后的模型,对模型的性能进行初步评估; 步骤6,根据初步评估结果判断模型性能是否达到设定指标;如果模型性能达到设 定指标则进行步骤7;如果模型性能未达到设定指标则重复步骤3至步骤5; 步骤7,用测试样本序列对验证后的模型进行测试,对模型的性能进行评估; 步骤8,根据评估结果判断模型性能是否达到设定指标;如果模型性能达到设定指 标则结束训练;如果模型性能未达到设定指标则调节控制因子,重复步骤2至步骤7。 进一步地,设CT图像原始切割层间距为s,中心图像的结节长度为l,控制因子为ν, R'为可浮动幅度,R'的表达式为:R'=INT(νR),其中R为中间变量,其表达式为: 进一步地,将测试样本集中的一组肺结节CT图像序列作为一组测试样本序列;标 注每组测试样本序列的序列序数,并对应序列序数设置相应的预测值权重;将一组测试样 本序列按照序数大小依次输入至训练后的CT图像肺结节分类神经网络模型,将每一层图像 的模型输出结果与预测值权重结合,得到该组测试样本序列在结节区域的综合预测值。 进一步地,设一组测试样本序列中的中间图像的序列序数为0,以中间图像为原 点,沿Z轴正方向对测试样本标注序列序数,序列序数为正值,沿Z轴负方向对测试样本标注 序列序数,序列序数为负值;设测试样本的图像序列序数为d,设对应测试样本的图像序列 序数d的预测值权重为β;β的计算方法如下式所示: 5 CN 111583179 A 说 明 书 3/7 页 式中,R'为可浮动幅度。 进一步地,设一组测试样本序列在结节区域的综合预测值为P,其计算方法如下式 所示: 式中:NP为测试样本序列起止序数中图像数量;βi为测试样本序列中第i层图像的 预测值权重;Pi为第i层图像的预测值,R'为可浮动幅度。 本发明具有的优点和积极效果是:训练模型时以浮动切割得到的二维图像作为模 型输入,以动态调整学习率的各样本训练模型。针对肺部CT图像的肺结节分类应用深度学 习方法过程中,动态进行模型训练以达到间接增大训练样本目的。训练过程中模型参数较 少而不需要使用较大计算存储资源的同时,使分类模型可训练学习到肺结节整体三维图像 信息,提高模型性能。测试模型时结合结节区域的测试样本整体序列图像及对应的预测值 权重,得到测试样本序列在结节区域的综合预测值,使得模型预测值不只依赖于专家标注 中间图像,减少主观性影响。本发明还可以适用其他将二维图像作为模型输入对三维图像 进行分类的分类神经网络模型中。 附图说明 图1是本发明的一种工作流程图。 图2是一组训练样本序列沿Z轴正负方向进行浮动切割示意图。 图3是一组二维肺结节图像序列示意图。 图中:I为中心图像,d表示图像序数,R表示肺结节单侧穿过层数,R'表示可浮动幅 度。
下载此资料需消耗2积分,
分享到:
收藏