logo好方法网

一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法


技术摘要:
本发明公开了一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法,包括:步骤一、采集待测试区域中海洋水温的垂直观测值;步骤二、根据变分自编码器得到所述垂直观测值在垂直观测层上的概率分布;步骤三、根据所述概率分布得到受采样影响模型所求得的解空间,  全部
背景技术:
回归树的本质是采用平方误差最小化的启发式方法对输入空间进行划  分,但训 练样本所包含的空间是有限的。也就是说训练样本所包含的输入空  间并不能有效覆盖我 们所要研究的所有空间,这也就意味着过拟合和局部空  间预测数据一致性是回归树方法 所面临的两大难题。随机森林有效利用  Bagging集成学习方法在用不稳定模型作为成员模 型时有很好的表现性能这  一特性,引入了随机向量子空间法这一不确定因素,进一步提高 了预测性能,  有效避免了回归树模型的过拟合和局部空间预测数据一致性问题。对于特征  较多的数据集,随机子空间法表现良好,但高分辨率海洋水温分布的问题仅  有三维特征, 再加之数据集的规则化,一定程度上弱化了随机森林方法解决  回归树的局部空间预测数 据一致性问题的能力,使得我们不能得到更高分辨 率的海洋水温分布数据。
技术实现要素:
本发明设计开发了一种基于变分自编码器的启发式高分辨率海洋水温分  布建立 方法,本发明的发明目的是解决数据不平衡导致海洋水温预测准确率  低的问题。 本发明提供的技术方案为: 一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法,包括  如下步 骤: 步骤一、采集待测试区域中海洋水温的垂直观测值; 步骤二、根据变分自编码器得到所述垂直观测值在垂直观测层上的概率 分布; 步骤三、根据所述概率分布得到受采样影响模型所求得的解空间,并根  据所述解 空间得到启发式网络; 步骤四、建立所述解空间和所述启发式网络的海洋水温分布模型,进而  得到待测 试区域中海洋水温。 优选的是,在所述步骤一中,所述待测试区域的经度范围为95°W~115°W,  纬度范 围为9.5°N~9.5°S,深度范围为0~1975m。 优选的是,在所述步骤二中,所述概率分布为 p(x)=∫pθ(x|z)p(z)dz; 式中,x代表垂直观测值,z代表隐变量,θ代表自动编码器中解码器的网  络层参 数,pθ(x|z)代表由重构的似然函数,p(z)代表满足高斯分布的噪声。 优选的是,在所述步骤二中,在确定所述概率分布的过程中,所述变分  自编码器 4 CN 111595489 A 说 明 书 2/8 页 的编码网络和解码网络的优化目标函数为 其中,L(θ,φ;x)=Eqθ(z|x)[-lnqθ(z|x) lnpθ(x,z)],qθ(z|x)代表,φ代表自动  编 码器中编码器的网络层参数,θ代表自动编码器中解码器的网络层参数。 优选的是,在所述步骤二中,在变分自编码器中,采用神经网络模型建  立解码网 络,包括输入层、输出层和两层隐层,相邻两层之间的神经元采用  全连接方式连接,同一层 之间的神经元无连接;输入层的神经元个数为16,  两层隐层的神经元个数均为128,输出层 的神经元个数为57;各神经元的激 活函数采用的ReLU激活函数。 优选的是,在所述步骤三中,所述概率分布和所述启发式网络通过MSE  损失函数 进行训练调参。 优选的是,在所述步骤三,采用神经网络模型建立所述启发式网络,包  括输入层、 输出层和两层隐层,相邻两层之间的神经元采用全连接方式连接, 同一层之间的神经元无 连接;输入层的神经元个数为57,两层隐层的神经元  个数均为128,输出层的神经元个数1; 输入层和隐层的各神经元的激活函数  采用的ReLU激活函数,输出层的激活函数为Tanh激 活函数。 优选的是,在所述步骤四中,采用神经网络模型建立海洋水温分布模型,  包括输 入层、输出层和三层隐层,相邻两层之间的神经元采用全连接方式连  接,同一层之间的神 经元无连接;输入层的神经元个数为3,第一、二层隐  层的神经元个数均为100;第三层隐层 的神经元个数为101,输出层的神经元  个数1;各神经元的激活函数采用的ReLU激活函数。 优选的是,还包括:将经度和纬度映射到所述隐变量所对应的空间所使  用的空间 映射网络,包括输入层、输出层和两层隐层,相邻两层之间的神经  元采用全连接方式连接, 同一层之间的神经元无连接;输入层的神经元个数  为2,第一层隐层的神经元个数均为 128,第二层隐层的神经元个数均为64,  输出层的神经元个数16;输入层和隐层的各神经元 的激活函数采用的ReLU  激活函数,输出层的激活函数为Sigmoid激活函数。 本发明与现有技术相比较所具有的有益效果: 该模型将监督学习和无监督学习相结合,首先以数据集中海洋水温的垂  直观测 值为输入向量,利用非监督学习方法变分自编码器学得海洋水温在垂  直观测层上的概率 分布;然后,利用学得的变分自编码器网络构建一个启发  式网络,用于解决数据集中的样 本不平衡性问题;最后将启发式网络和深度  学习回归网络相结合,解决数据集中样本稀疏 性问题;实验结果表明,本文  所提模型与简单海洋水温预测深度回归学习模型相比预测准 确度提高了约  0.084,约47.8%,从一定程度上能够缓解数据集样本不平衡性问题;和随机  森林方法分辨率提升程度受限不同,本模型理论上可将海洋水温的空间分辨  率提升至任 意程度。 附图说明 图1为本发明所述的VAE概率图模型示意图。 图2为本发明所述的VAE网络结构示意图。 图3为全球海洋Argo网格资料数据集上海洋水温的概率密度函数示意 图。 图4为变分自编码器的“解码”网络示意图。 5 CN 111595489 A 说 明 书 3/8 页 图5为本发明所述的解空间函数示意图。 图6为本发明所述的启发式网络示意图。 图7为本发明所构建的基于变分自编码器的启发式高分辨率海洋水温模  型示意 图。 图8为本发明所述的启发式模型和普通模型的比较图。 图9(a)为20米处原始数据示意图。 图9(b)为20米处0.01°水平分辨率、1米垂直分辨率数据示意图。 图10(a)为60米处原始数据示意图。 图10(b)为60米处0.01°水平分辨率、1米垂直分辨率数据示意图。 图11(a)为110米处原始数据示意图。 图11(b)为110米处0.01°水平分辨率、1米垂直分辨率数据示意图。 图12为海平面不同温度分布情况示意图。 图13为20摄氏度海洋水温等温面示意图。
下载此资料需消耗2积分,
分享到:
收藏