一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法-好方法网

技术摘要：
本发明公开了一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法，包括：步骤一、采集待测试区域中海洋水温的垂直观测值；步骤二、根据变分自编码器得到所述垂直观测值在垂直观测层上的概率分布；步骤三、根据所述概率分布得到受采样影响模型所求得的解空间，全部
背景技术：
回归树的本质是采用平方误差最小化的启发式方法对输入空间进行划分，但训练样本所包含的空间是有限的。也就是说训练样本所包含的输入空间并不能有效覆盖我们所要研究的所有空间，这也就意味着过拟合和局部空间预测数据一致性是回归树方法所面临的两大难题。随机森林有效利用 Bagging集成学习方法在用不稳定模型作为成员模型时有很好的表现性能这一特性，引入了随机向量子空间法这一不确定因素，进一步提高了预测性能，有效避免了回归树模型的过拟合和局部空间预测数据一致性问题。对于特征较多的数据集，随机子空间法表现良好，但高分辨率海洋水温分布的问题仅有三维特征，再加之数据集的规则化，一定程度上弱化了随机森林方法解决回归树的局部空间预测数据一致性问题的能力，使得我们不能得到更高分辨率的海洋水温分布数据。
技术实现要素：
本发明设计开发了一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法，本发明的发明目的是解决数据不平衡导致海洋水温预测准确率低的问题。本发明提供的技术方案为：一种基于变分自编码器的启发式高分辨率海洋水温分布建立方法，包括如下步骤：步骤一、采集待测试区域中海洋水温的垂直观测值；步骤二、根据变分自编码器得到所述垂直观测值在垂直观测层上的概率分布；步骤三、根据所述概率分布得到受采样影响模型所求得的解空间，并根据所述解空间得到启发式网络；步骤四、建立所述解空间和所述启发式网络的海洋水温分布模型，进而得到待测试区域中海洋水温。优选的是，在所述步骤一中，所述待测试区域的经度范围为95°W～115°W，纬度范围为9.5°N～9.5°S，深度范围为0～1975m。优选的是，在所述步骤二中，所述概率分布为 p(x)＝∫pθ(x|z)p(z)dz；式中，x代表垂直观测值，z代表隐变量，θ代表自动编码器中解码器的网络层参数，pθ(x|z)代表由重构的似然函数，p(z)代表满足高斯分布的噪声。优选的是，在所述步骤二中，在确定所述概率分布的过程中，所述变分自编码器 4 CN 111595489 A 说　明　书 2/8 页的编码网络和解码网络的优化目标函数为其中，L(θ，φ；x)＝Eqθ(z|x)[-lnqθ(z|x) lnpθ(x，z)]，qθ(z|x)代表，φ代表自动编码器中编码器的网络层参数，θ代表自动编码器中解码器的网络层参数。优选的是，在所述步骤二中，在变分自编码器中，采用神经网络模型建立解码网络，包括输入层、输出层和两层隐层，相邻两层之间的神经元采用全连接方式连接，同一层之间的神经元无连接；输入层的神经元个数为16，两层隐层的神经元个数均为128，输出层的神经元个数为57；各神经元的激活函数采用的ReLU激活函数。优选的是，在所述步骤三中，所述概率分布和所述启发式网络通过MSE 损失函数进行训练调参。优选的是，在所述步骤三，采用神经网络模型建立所述启发式网络，包括输入层、输出层和两层隐层，相邻两层之间的神经元采用全连接方式连接，同一层之间的神经元无连接；输入层的神经元个数为57，两层隐层的神经元个数均为128，输出层的神经元个数1；输入层和隐层的各神经元的激活函数采用的ReLU激活函数，输出层的激活函数为Tanh激活函数。优选的是，在所述步骤四中，采用神经网络模型建立海洋水温分布模型，包括输入层、输出层和三层隐层，相邻两层之间的神经元采用全连接方式连接，同一层之间的神经元无连接；输入层的神经元个数为3，第一、二层隐层的神经元个数均为100；第三层隐层的神经元个数为101，输出层的神经元个数1；各神经元的激活函数采用的ReLU激活函数。优选的是，还包括：将经度和纬度映射到所述隐变量所对应的空间所使用的空间映射网络，包括输入层、输出层和两层隐层，相邻两层之间的神经元采用全连接方式连接，同一层之间的神经元无连接；输入层的神经元个数为2，第一层隐层的神经元个数均为 128，第二层隐层的神经元个数均为64，输出层的神经元个数16；输入层和隐层的各神经元的激活函数采用的ReLU 激活函数，输出层的激活函数为Sigmoid激活函数。本发明与现有技术相比较所具有的有益效果：该模型将监督学习和无监督学习相结合，首先以数据集中海洋水温的垂直观测值为输入向量，利用非监督学习方法变分自编码器学得海洋水温在垂直观测层上的概率分布；然后，利用学得的变分自编码器网络构建一个启发式网络，用于解决数据集中的样本不平衡性问题；最后将启发式网络和深度学习回归网络相结合，解决数据集中样本稀疏性问题；实验结果表明，本文所提模型与简单海洋水温预测深度回归学习模型相比预测准确度提高了约 0.084，约47.8％，从一定程度上能够缓解数据集样本不平衡性问题；和随机森林方法分辨率提升程度受限不同，本模型理论上可将海洋水温的空间分辨率提升至任意程度。附图说明图1为本发明所述的VAE概率图模型示意图。图2为本发明所述的VAE网络结构示意图。图3为全球海洋Argo网格资料数据集上海洋水温的概率密度函数示意图。图4为变分自编码器的“解码”网络示意图。 5 CN 111595489 A 说　明　书 3/8 页图5为本发明所述的解空间函数示意图。图6为本发明所述的启发式网络示意图。图7为本发明所构建的基于变分自编码器的启发式高分辨率海洋水温模型示意图。图8为本发明所述的启发式模型和普通模型的比较图。图9(a)为20米处原始数据示意图。图9(b)为20米处0.01°水平分辨率、1米垂直分辨率数据示意图。图10(a)为60米处原始数据示意图。图10(b)为60米处0.01°水平分辨率、1米垂直分辨率数据示意图。图11(a)为110米处原始数据示意图。图11(b)为110米处0.01°水平分辨率、1米垂直分辨率数据示意图。图12为海平面不同温度分布情况示意图。图13为20摄氏度海洋水温等温面示意图。

相关推荐