技术摘要:
本发明公开一种在样本不平衡条件下显微图像的细胞识别方法及系统,该方法针对实际应用中用于模型训练的各类样本不平衡的问题,利用深度卷积生成对抗网络生成与各类样本中数量较少的样本服从近似分布的新细胞图像,以扩充数量较少样本的数量,以解决各类样本不平衡的问 全部
背景技术:
在有监督的识别模型训练过程中,通常假定训练样本各类别是同等数量即各类别 样本数量是均衡的。但在实际标记过程中发现,用于模型训练的不同类别的样本数量相差 悬殊,也就是各类样本不平衡,这会导致训练的模型过拟合,从而影响最终的识别精度。
技术实现要素:
本发明提供一种在样本不平衡条件下显微图像的细胞识别方法及系统,用于克服 现有技术中模型训练的各类样本不平衡等缺陷。 为实现上述目的,本发明提出一种在样本不平衡条件下显微图像的细胞识别方 法,所述细胞识别方法包括: 采集显微图像,提取显微图像中的细胞图像并对所述细胞图像进行细胞形态学特征和 病变类型标注,形成训练集; 选取所述训练集中各个病变类型对应的细胞图像数量靠后的病变类型,利用选取的病 变类型对应的标注细胞图像以及对应的细胞形态学特征对预先构建的深度卷积生成对抗 网络进行训练; 利用训练好的深度卷积生成对抗网络产生与所述标注细胞图像服从近似分布的新细 胞图像,将所述新细胞图像加入所述训练集,形成平衡训练集; 获取所述平衡训练集中各个细胞图像的细胞特征,利用所述平衡训练集中的细胞图像 和各个细胞图像的细胞特征对预先构建的卷积神经网络进行训练;所述细胞特征包括细胞 核浆比特征、细胞核纹理特征和细胞形态学特征; 提取待测显微图像中的细胞图像,获取待测显微图像中细胞图像的细胞特征,将待测 显微图像中的细胞图像及其对应的细胞特征输入训练好的卷积神经网络进行细胞识别,获 得待测显微图像中细胞的病变类型。 为实现上述目的,本发明还提出在样本不平衡条件下显微图像的细胞识别系统, 包括: 图像采集模块,用于采集显微图像,提取显微图像中的细胞图像并对所述细胞图像进 行细胞形态学特征和病变类型标注,形成训练集; 深度卷积生成对抗网络训练模块,用于选取所述训练集中各个病变类型对应的细胞图 像数量靠后的病变类型,利用选取的病变类型对应的标注细胞图像以及对应的细胞形态学 特征对预先构建的深度卷积生成对抗网络进行训练; 显微图像生成模块,用于利用训练好的深度卷积生成对抗网络产生与所述标注细胞图 像服从近似分布的新细胞图像,将所述新细胞图像加入所述训练集,形成平衡训练集; 5 CN 111739017 A 说 明 书 2/10 页 卷积神经网络训练模块,用于获取所述平衡训练集中各个细胞图像的细胞特征,利用 所述平衡训练集中的细胞图像和各个细胞图像的细胞特征对预先构建的卷积神经网络进 行训练;所述细胞特征包括细胞核浆比特征、细胞核纹理特征和细胞形态学特征; 细胞识别模块,用于提取待测显微图像中的细胞图像,获取待测显微图像中细胞图像 的细胞特征,将待测显微图像中的细胞图像及其对应的细胞特征输入训练好的卷积神经网 络进行细胞识别,获得待测显微图像中细胞的病变类型。 为实现上述目的,本发明还提出一种计算机设备,包括存储器和处理器,所述存储 器存储有计算机程序,所述处理器执行所述计算机程序时实现上述所述方法的步骤。 为实现上述目的,本发明还提出一种计算机可读存储介质,其上存储有计算机程 序,所述计算机程序被处理器执行时实现上述所述方法的步骤。 与现有技术相比,本发明的有益效果有: 本发明提出的在样本不平衡条件下显微图像的细胞识别方法针对实际应用中用于模 型训练的各类样本不平衡的问题,利用深度卷积生成对抗网络生成与各类样本(不同病变 类型的细胞图像)中数量较少的样本服从近似分布的新细胞图像,以扩充数量较少样本的 数量,以解决各类样本不平衡的问题;然后利用平衡训练集中各个细胞图像及对应的细胞 特征对卷积神经网络进行训练,可有效避免卷积神经网络过拟合,且细胞图像和细胞特征 的同时训练可获得精度较高的卷积神经网络;最后利用训练好的卷积神经网络进行细胞识 别。本发明的方法通过扩充数量较少的样本、充分利用细胞空间结构信息和传统医生判别 特征,有效提升网络的准确度。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图示出的结构获得其他的附图。 图1为本发明提供的在样本不平衡条件下显微图像的细胞识别方法流程图; 图2为本发明实施例中深度卷积生成对抗网络的结构图; 图3为本发明实施例中卷积神经网络的结构图。 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。