logo好方法网

基于地统计和神经网络的地下水位缺失数据的修复方法


技术摘要:
本发明为地下水位修复技术领域,是基于地统计和神经网络的地下水位缺失数据的修复方法,从空间和时间角度构建修复模型,提高了数据缺失插补的准确性和可靠性;包括步骤:将地下水位的时空数据集分为时空序列数据集和时间序列数据集;根据时空序列数据集,采用克里金法  全部
背景技术:
基于统计学的缺失数据修复方法中,最早用来填补缺失数据的方法有均值填补 法、分层均值填补法、最大期望算法、多重填补法等统计方法。其中,均值填补法利用前后两 个观测值的平均值或者是非缺失数据的均值来填补缺失值;分层均值填补法将地下水数据 按每年的相同月份进行分层,取每个层的平均值代替缺失值;最大期望算法对缺失数据利 用数学公式进行最大似然估计,并不断迭代,具有较好的实用价值;多重填补法为对最大期 望算法不足的进一步改进,利用蒙特卡罗方法进行最大似然估计,并且创建多套插补值,从 中随机抽取一套来代替缺失值。 可通过建立回归方程计算缺失数据时刻的值来进行插值;而基于回归原理的方法 包括线性回归、支持向量机回归及多元回归。 在基于地统计的缺失数据修复方法中,地统计中的空间插值模型是时空序列缺失 修复的基础,针对点的空间插值主要有反距离加权(IDW)、移动拟合、线性内插、双线性多项 式插值、样条插值、克里金插值和地理加权回归等。 在基于混合模型的缺失数据修复方法中,目前已有的混合模型有基于克里金和向 量机回归混合模型、遗传算法和多元回归混合模型。 现有的基于统计学原理的修复方法仅仅是从数据集的数学统计特性出发进行填 补,没有数据所代表的实际意义,忽略了数据背后的隐藏信息,适用于随机缺失的地下水位 数据。但是地下水位是多种因素共同作用的结果,随机性低,并且连续缺失的情况较多;因 此,基于统计学原理的修复方法效果差强人意,且使用条件受限较多,缺失数据的插补方法 单一。 此外,地统计方法是单纯从空间角度来对数据进行插补,而线性回归、SVM回归、机 器学习的方法只考虑数据的时间特性而没有考虑数据的空间特性,导致插值的结果不理 想。而现有的混合学习方法中与地统计相结合的回归方法在自学习和拟合的能力不如人工 神经网络速度快、效果好。因此需要寻找一种结合地统计与机器学习法各自优点的技术方 案。
技术实现要素:
为解决现有技术所存在的技术问题,本发明提供基于地统计和神经网络的地下水 位缺失数据的修复方法。该方法针对地下水位监测值的时空特性,利用地统计学理论和人 工神经网络算法,从空间和时间角度构建适用于地下水位监测值特征的空间修复模型和时 间修复模型,并根据时空要素扩展方法,构建能较好评估时空要素和具有较高精度的地下 水位数据缺失修复混合模型,提高了数据缺失插补的准确性和可靠性。 4 CN 111597080 A 说 明 书 2/4 页 本发明采用以下技术方案来实现:基于地统计和神经网络的地下水位缺失数据的 修复方法,包括以下步骤: S1、获取地下水位的时空数据集,并编辑时空数据集,将时空数据集分为有经纬度 信息的时空序列数据集和无经纬度信息的时间序列数据集; S2、根据时空序列数据集,采用克里金法插补缺失值,进行基于地统计的空间插 值,得到修复后的空间数据集; S3、建立基于BP人工神经网络的时间序列缺失值修复模型,对时间序列数据集的 缺失数据进行修复; S4、将步骤S2的空间修复结果导入机器学习算法中,并与步骤S3的时间修复结果 和实际检测数据进行训练学习,通过机器学习不断调整时空要素权重,构建地下水位时空 序列缺失数据的混合修复模型; S5、利用步骤S4所构建的混合修复模型对地下水位时空监测数据集中的缺失数据 进行修复,从而得到完整的地下水位观测数据。 与现有技术相比,本发明取得了如下技术效果: 1、完善现有地统计方法由于单纯从数据的数学统计角度出发进行缺失数据的填 补,本发明从地下水位监测数据本身在时间和空间的特性综合考虑,对缺失数据进行插值, 提高了数据缺失插补的准确性和可靠性。 2、克服了现有单一的插值方法对插值结果过于片面,使得对时空数据的插值结果 不理想的缺陷,本发明从空间和时间角度构建适用于地下水位监测值特征的混合模型,从 而能够从时间和空间两个角度对缺失数据进行插值,有效提高了插值结果的精度和可靠 性。 3、现有缺失数据修复方法适用于随机缺失且偶然有一个缺失的现象,而无法处理 连续时段的缺失情况;而本发明通过人工神经网络自学习和自拟合的特性能够弥补连续缺 失数据无法插补、插补质量差的情况。 附图说明 图1是本发明修复方法的流程图。
下载此资料需消耗2积分,
分享到:
收藏