logo好方法网

一种适于小样本的神经网络模型训练方法

技术摘要:
本发明提供了一种适于小样本的神经网络模型训练方法,该方法通过选取合适的数理方程得到与医学诊断任务相关的物理量,以多任务学习的方式提供额外的引导和正则化对神经网络模型进行辅助训练,大幅降低了对样本量的需求。并且,本发明中涉及的隐空间特征与生理过程紧密  全部
背景技术:
随着机器学习方法的不断发展,以深度神经网络算法为代表的现代人工智能方法 可应用到医学自动诊断中。用于医学诊断的机器学习算法一般采取监督式学习框架,即提 供一定数量的医疗设备采集到的信号和相对应的诊断结果作为模型的输入输出,然后不断 调整模型参数使目标函数达到最优。由于深度神经网络的参数个数常超过百万,需要相匹 配的大量样本进行训练,但这在医疗领域是难以获得和昂贵的。样本容量的不足容易导致 模型的过拟合,降低诊断结果准确性。另外,深度神经网络的黑盒特性使得模型缺乏可解释 性能,从而影响了医学诊断结果的可靠性。 数理方程常被用来刻画人体内的生理过程,可从医疗设备的测量信号中反演出相 关物理量,反应人体内的生理状态,为医学诊断提供参考。相较于数据驱动的机器学习算 法,数理方程源于理论推导,可直接进行求解,无需样本训练。但其缺点在于包含了一系列 的假设和简化,与人体内的真实情况存在偏差。 针对深度神经网络在医学诊断中遇到的困难,本发明结合与诊断结果相关的数理 方程,以多任务学习的方式为神经网络提供额外的监督和正则性,大幅降低了对样本量的 需求。并且,本发明中涉及的隐变量空间与生理过程紧密关联,提高了诊断结果的可靠性。
技术实现要素:
本发明的目的是为了获得一种不需要大量训练样本集的神经网络训练模型,对医 疗设备采集的信号进行处理和诊断。本发明的主要思想是,通过选取合适的数理方程得到 与医学诊断任务相关的物理量,以多任务学习的方式为模型提供额外的引导和正则化,提 出了一种适于小样本的神经网络模型训练方法。 本发明采用的技术方案如下: 一种适于小样本的神经网络模型训练方法,通过选取合适的数理方程得到与医学 诊断任务相关的物理量,以多任务学习的方式提供额外的引导和正则化对神经网络模型进 行训练,该方法具体包括如下步骤: (1)采集训练样本:训练样本集合包括N个医疗信号的样本X={X1,X2,…,XN}和相 对应的诊断结果y={y1,y2,…,yN}。 (2)选取数理方程获取相对应的物理量:选取描述生理过程的数理方程,并挑选出 m个与步骤1中诊断结果相关的物理量q=[q(1),q(2),…q(k)…,q(m)] ,其中q(k)为第k个物理 量。对于每一个训练样本Xi通过求解数理方程获取相对应的物理量qi,从而获取样本相对应 的物理量标注集合。 (3)构建神经网络训练模型:所述神经网络训练模型包括用于将医疗信号编码成 3 CN 111584072 A 说 明 书 2/5 页 隐空间特征的信号编码网络E、用于将隐空间特征解码成诊断结果的诊断分析网络F和用于 将隐空间特征解码成物理量的数理解码网络M; (4)构建目标函数L:所述目标函数L包括主任务和数理辅助任务两部分: 其中D1(.,.)和D2(.,.)分别为度量函数,用来比较模型预测结果和真实结果的偏 差,D1(.,.)比较诊断结果的偏差,D2(.,.)比较物理量的偏差。β为模型的超参数。 (5)训练深度神经网络模型:利用步骤1中样本训练集合和步骤2中计算出的物理 量,采用梯度反向传播算法,不断更新神经网络训练模型的参数,直至目标函数L收敛,完成 训练。 进一步地,所述医疗信号为医疗设备直接获得测量结果或基于测量信号进一步处 理得到的结果。 进一步地,所述信号编码网络E为时序神经网络或卷积神经网络。 进一步地,所述诊断网络F采用若干层的全连接神经网络。 进一步地,所述数理解码网络M采用若干层的全连接神经网络。 本发明的有益效果是:本发明训练方法通过选取合适的数理方程得到与医学诊断 任务相关的物理量,为模型训练提供额外的监督,大幅降低了对样本量的需求。同时引导模 型生成有物理意义的隐空间,该隐空间特征与生理过程紧密关联,极大地提高了模型及其 诊断结果的可靠性。 附图说明 图1为本发明方法的结构原理图。 图2为本发明方法应用到脑血管疾病诊断中训练模型的流程图。 图3为本发明方法应用到颈动脉粥样硬化斑块稳定性评估中训练模型的流程图。
分享到:
收藏