logo好方法网

弯曲染色体图像拉直模型生成方法、模型的应用、系统、可读存储介质及计算机设备


技术摘要:
本发明揭示了弯曲染色体图像拉直模型生成方法、模型的应用、系统、可读存储介质及计算机设备,其中生成方法包括如下步骤,获取弯曲染色体原图处理得到染色体图;根据染色体图生成染色体缩放图及染色体弯曲骨架图;进行染色体缩放图和染色体弯曲骨架图的数据增广及对增  全部
背景技术:
随着电子计算机技术和人工智能领域的发展,通过计算机算法实现图像的识别和 分割已经可以初步实现,且医学上一般使用图像分析技术用于医疗影像中物体的检测、分 离和提取。但是当被检测物体处于不同的形态时,例如弯曲和重叠,图形学算法往往不能像 素级别地改变物体的形态。 人类的基因信息是被承载在染色体上的,因而染色体核型分析是细胞遗传学研究 的基本方法,是研究染色体形态和结构与其功能的联系,探究染色体异常和遗传缺陷的关 联的重要手段。但是由于染色体自身的性质,染色体经常处于弯曲的形态。相较于处于竖直 形态,弯曲形态的染色体往往给染色体鉴定,分类和功能研究带来阻碍,且人工分析耗时耗 力巨大。现有的染色体拉直技术则基于切割和拼接等图形学的算法,其缺点是不能柔性的 对图像进行像素级别的拉直,且会产生明显的切割痕迹和拼接处的空白。 例如文献《一种关于高度弯曲染色体图的拉直方法》Roshtkhari ,M .J .  and  Setarehdan,S.K.,2008.A  novel  algorithm  for  straightening highly  curved  images  of  human  chromosome.Pattern  recognition  letters,29(9) ,pp.1208——1217.,揭示了 一种染色体拉直的手段,采用定位最大弯曲处,并在最大弯曲处切割后对两端进行旋转和 拼接。这样的方式适用于染色体只存在一个较大弯曲,而在不同实验和精细度中拍摄的染 色体照片经常会出现三个乃至更多的弯曲,所以这个算法经常出现拉直的错误,且切割再 拼接的空白也会使染色体信息不连续,远远不能达到使用要求。
技术实现要素:
本发明的目的之一就是为了解决现有技术中存在的上述问题,提供一种基于 BagPix2Pix自学习模型的弯曲染色体图像拉直模型生成方法,基于深度学习中的卷积神经 网络,对经过弹性形变和随机旋转等增广后的染色体骨架图和对应染色体图的高纬度特征 进行提取,并通过对抗训练的方法使模型学习到从骨架生成相应染色体图的模式,从而为 柔性地生成染色体拉直图提供可行的处理工具。 本发明的目的通过以下技术方案来实现: 弯曲染色体图像拉直模型生成方法,包括如下步骤, S10,获取弯曲染色体原图,预处理得到去除杂质的染色体图; S20,根据染色体图,生成染色体缩放图; S30,根据染色体图,生成染色体弯曲骨架图; S40,进行染色体缩放图和染色体弯曲骨架图的数据增广; 5 CN 111612744 A 说 明 书 2/12 页 S50,对S40得到的增广后的染色体缩放图和染色体弯曲骨架图进行归一化处理, 得到训练数据集; S60,将S50得到的训练数据集输入弯曲染色体图像拉直模型进行训练至模型收 敛。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S10包括: S101,获取k张显微镜拍摄的弯曲染色体图像,并转化为灰度图; S102,对S101得到的每张灰度图进行标记,将图中染色体部分标记为  1值像素,杂 质和背景部分标记为0值像素,获得标记图; S103,将每张标记图中1值像素保持原色,将0值像素转变为黑色。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S20包括: S201,计算染色体图中染色体部分的长和宽及判断长、宽与设定值a 的大小,若长 和宽均小于设定值a,则执行S202;若长或宽至少一大于a,则执行S203; S202,以染色体为中心,将染色体图片的黑色区域扩充至a×a像素大小; S203,将长、宽中较大的一个缩放至a,将另一个按比例缩放,并将不足a长度的部 分填充为黑色。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S30包括: S301,记录染色体图的每一行中属于染色体部分的首个像素及最后一个像素; S302,求出每一行的属于染色体部分的首个像素及最后一个像素的中间点的坐标 (X,Y); S303,将所有求出的Y值平均分成n等分,形成n个均分点; S304,将等分后,除第一个均分点和最后一个均分点之外的均分点定为弯曲染色 体的骨架锚点; S305,新建一张a×a大小的黑色背景图片,在此图片上定位所述S304  步骤确定的 骨架锚点; S306,用一定宽度的线段将S305中的骨架锚点依次连接起来,得到染色体弯曲骨 架图。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S306中,多条线段的像 素值依次增大或减小。 优选的,所述的弯曲染色体图像拉直模型生成方法中,若染色体弯曲幅度过大或 骨架锚点定位在染色体之外,则人工标记目标数量个点作为骨架锚点。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S40包括: S401,采用弹性形变法和随机旋转法进行染色体缩放图和染色体弯曲骨架图数据 增广; S402,重复S401,形成m对增广后的染色体缩放图和染色体弯曲骨架图。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述随机旋转法的旋转角 度在-45°~45°之间。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S50包括: S501,对S40得到的增广后的染色体缩放图和染色体弯曲骨架图进行归一化处理; S502,将经过归一化处理的数据随机分成两组,一组作为训练集,一组作为验证 6 CN 111612744 A 说 明 书 3/12 页 集。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述S60包括: S601,使用自学习模型中的卷积核根据步长在输入的图片上逐行滑动提取图片的 局部与全局特征; S602,对S601生成的特征映射图进行批归一化操作; S603,对S602中提取的特征进行非线性映射; S604,对S603中提取的特征添加随机噪声; S605,将要串联起来的特征图保持同一纬度; S606,使用上采样的方式对输入的特征映射图进行深度的加深; S607,使用反卷积的方式还原图像分辨率和细节特征,并与同维度下卷积核提取 的图像特征进行串联; S608,模型生成器的最后一层卷积层后使用tanh函数,通过非线性映射的方式,获 得输入图经过生成器后生成的输出图; S609,通过极小化生成器(G)和极大化判别器(D)的方法来进行对抗神经网络训 练, 其中,xB为输入的骨架图,yB为输入的染色体图,z为通过Dropout函数输入的随机 噪声。 优选的,所述的弯曲染色体图像拉直模型生成方法中,所述弯曲染色体图像拉直 模型包括一个生成器和一个判别器;所述生成器包括一条编码路径和一条解码路径。 本方案的另一目的在于提供一种上述弯曲染色体图像拉直模型的应用方法,包括 如下步骤: 根据上述任一方法得到的弯曲染色体图像拉直模型; 根据接收的弯曲染色体原图,构建染色体拉直骨架图; 将染色体拉直骨架图输入弯曲染色体图像拉直模型,弯曲染色体图像拉直模型输 出染色体拉直图像。 本方案的又一目的在于提供一种用于实现上述生成方法的弯曲染色体图像拉直 模型的生成系统,包括 预处理单元,用于获取弯曲染色体原图,预处理得到去除杂质的染色体图; 缩放图生成单元,用于根据染色体图生成染色体缩放图; 弯曲骨架图生成单元,用于根据染色体图生成染色体弯曲骨架图; 增广单元,用于进行染色体缩放图和染色体弯曲骨架图的数据增广; 归一化单元,用于对增广单元得到的增广后的染色体缩放图和染色体弯曲骨架图 进行归一化处理,得到训练数据集; 训练单元,用于将训练数据集输入弯曲染色体图像拉直模型进行训练至模型收 敛。 7 CN 111612744 A 说 明 书 4/12 页 可读存储介质,存储有实现上述任一的弯曲染色体图像拉直模型生成方法的程 序。 本方案最后一目的在于提供一种计算机设备,包括存储器、处理器及通信总线;所 述通信总线用于实现处理器和存储器之间的连接通信;所述处理器用于执行存储器中存储 的程序以实现上述任一的弯曲染色体图像拉直模型生成方法。 本发明技术方案的优点主要体现在: 本方案能够准确地通过单一染色体图构建增广数据集,并通过拉直骨架来精确生 成拉直的染色体图,并保留染色体细节信息,以此高质量的完成人类弯曲染色体柔性拉直 目标,与现有的基于图像学的方法相比,此方法的结果不包含明显的断裂和切面,极大的提 升了拉直后染色体图像的质量和有效特征的完整性和连续性,且不受弯曲个数和弯曲部位 的影响,准确性高,实用性强。 本方案基于深度学习模型,能在保留染色体细节信息的前提下提取染色体图像特 征,并通过对抗性训练的方法自学习图像局部与全局特征和由骨架图生成相应染色体图的 生成方式,以此来对染色体进行柔性的拉直,为弯曲染色体图像的拉直提供了可行的、准确 性高的处理工具。 拉直的染色体相比于原始弯曲的染色体,能为神经网络提供更高的分类准确率, 并协助计算机构建更准确的分类模型和帮助医护人员更便捷的观察区分染色体中的异常 和病变区域。 附图说明 图1为
分享到:
收藏