logo好方法网

一种基因调控网络重构的方法、系统、设备及介质


技术摘要:
本发明公开了一种基因调控网络重构的方法、系统、设备和存储介质,方法包括:对基因表达数据进行编码,并对所述编码后的数据进行解码以得到重构数据;对所述重构数据进行处理得到隐状态,对所述隐状态进行特征提取;以及基于提取的所述特征构建基因调控关系矩阵,并根  全部
背景技术:
随着大数据技术的不断发展,目前诞生了海量的基因表达数据。通过对这些数据 进行分析,并使用相应的算法模型去预测基因直接的调控关系,构建基因调控网络成为生 物信息学领域一个非常热门的研究话题。重构基因调控网络有助于从复杂网络的角度去剖 析和解释生物体内复杂系统的动力学方式,进而理解基因表达调控在生物系统中发挥的作 用。进一步而言,其可以有效的指导生物医学领域的许多研究,例如特效药的研发,重大疾 病的发病机制等。 目前研究常用的基因表达数据有两种,一是时间序列数据,二是实验扰动数据。通 常前者是通过研究人员在不同时间点通过相应的采集设备采集的基因表达数据。后者是通 过采用抑制生物基因,敲除独特基因等策略来定制度量生物基因之间是否存在调控作用。 随着大数据技术以及深度学习技术的不断发展,研究者们通过使用第一类数据进行研究, 通过采用一些相应的算法模型来重构基因调控网络。 目前基因调控网络重构的方法虽然在网络重构的精度和降低算法时间复杂度上 取得了一定的进展,但是以往的方法往往仅能解决中小网络(低于100个节点)的重构问题。 对于大规模尺度的网络,一般采用聚类的方式来降低基因节点的数目,然后在在同一类别 中挖掘基因间的调控关系。该方法往往需要事先指定聚类块的数量,并需要选择合适的分 析模型,需要较强的专业知识。
技术实现要素:
有鉴于此,本发明实施例的目的在于提出一种基因调控网络重构的方法、系统、计 算机设备及计算机可读存储介质,通过压缩感知技术可以有效的过滤掉数据中的噪声,保 留数据中的时不变特征;通过时间注意力模型对基因调控网络进行重构可以不需要较强的 专业知识,并能够提高预测精度。 基于上述目的,本发明实施例的一方面提供了一种基因调控网络重构的方法,包 括如下步骤:对基因表达数据进行编码,并对所述编码后的数据进行解码以得到重构数据; 对所述重构数据进行处理得到隐状态,对所述隐状态进行特征提取;以及基于提取的所述 特征构建基因调控关系矩阵,并根据所述基因调控关系矩阵重构基因调控网络。 在一些实施方式中,所述对基因表达数据进行编码,并对所述编码后的数据进行 解码以得到重构数据包括:对所述基因表达数据进行正交变换以得到第一输出,保留所述 第一输出中与平均值之差小于预设值的多个分量和所述多个分量对应的位置,并删除其他 分量;以及在其他分量的位置补零以得到第二输出,并对所述第二输出进行反变换以得到 重构数据。 4 CN 111583991 A 说 明 书 2/9 页 在一些实施方式中,所述基于提取的所述特征构建基因调控关系矩阵包括:计算 每一行特征的权重,并基于权重对特征进行加权求和以得到第三输出,基于所述第三输出 构建所述基因调控关系矩阵。 在一些实施方式中,还包括:计算重构后的所述基因调控网络的评价指数,并判断 所述评价指数是否均大于阈值。 本发明实施例的另一方面,还提供了一种基因调控网络重构的系统,包括:编解码 模块,配置用于对基因表达数据进行编码,并对所述编码后的数据进行解码以得到重构数 据;特征模块,配置用于对所述重构数据进行处理得到隐状态,对所述隐状态进行特征提 取;以及重构模块,配置用于基于提取的所述特征构建基因调控关系矩阵,并根据所述基因 调控关系矩阵重构基因调控网络。 在一些实施方式中,所述编解码模块配置用于:对所述基因表达数据进行正交变 换以得到第一输出,保留所述第一输出中与平均值之差小于预设值的多个分量和所述多个 分量对应的位置,并删除其他分量;以及在其他分量的位置补零以得到第二输出,并对所述 第二输出进行反变换以得到重构数据。 在一些实施方式中,所述重构模块还配置用于:计算每一行特征的权重,并基于权 重对特征进行加权求和以得到第三输出,基于所述第三输出构建所述基因调控关系矩阵。 在一些实施方式中,还包括:检测模块,配置用于计算重构后的所述基因调控网络 的评价指数,并判断所述评价指数是否均大于阈值。 本发明实施例的又一方面,还提供了一种计算机设备,包括:至少一个处理器;以 及存储器,所述存储器存储有可在所述处理器上运行的计算机指令,所述指令由所述处理 器执行时实现如上方法的步骤。 本发明实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储 介质存储有被处理器执行时实现如上方法步骤的计算机程序。 本发明具有以下有益技术效果:通过压缩感知技术可以有效的过滤掉数据中的噪 声,保留数据中的时不变特征;通过时间注意力模型对基因调控网络进行重构可以不需要 较强的专业知识,并能够提高预测精度。 附图说明 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现 有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以 根据这些附图获得其他的实施例。 图1为本发明提供的基因调控网络重构的方法的实施例的示意图; 图2为本发明提供的基因调控网络重构的计算机设备的实施例的硬件结构示意 图。
分享到:
收藏