logo好方法网

基于动态时间规整的钻进过程数据异常判别与校正的方法


技术摘要:
本发明提供了一种基于动态时间规整的钻进过程数据异常判别与校正的方法,采用马氏距离据进行离群点检测,得到离群点数据的集合;利用动态时间规整算法检测每个离群点数据附近区域内两个时间序列的相似性,由模糊C均值聚类算法确定该离群点是属于由传感检测误差等外界因  全部
背景技术:
目前,我国社会经济保持着高速发展的势头,对资源能源的需求度也越来  越高。 然而,我国当前的矿产资源勘探深度平均只有500米,油气开采深度平均  也不足4500米。按 照矿产资源勘探深度来界定深部钻探,我国深层石油资源占  剩余石油资源的40%左右,深 层天然气资源占剩余天然气资源的60%左右。同 时,据初步统计我国深部非常规能源储量 可观,页岩气可开采储量为36.0825万  亿立方米,约占世界总证实储量的20%左右;埋深 2000米以上的煤层气地质资  源约为36.81万亿立方米,占世界煤层气总资源的13%左右。 因此,随着浅层资  源能源的枯竭、大量深部资源及非常规能源的探明,深部地质勘探开发 成为必然。 钻进过程涉及的信息种类较多,是地下相同地质体的综合反映,具有较强 的相关 性,通过他们可以反映出当前钻井环境。其中工程参数是钻井工况的反映,  参数的采集和 应用是提高钻井效益和安全施工的必要手段,因此参数的采集至关  重要。 然而在深部勘探过程中直接检测的钻进过程参数存在着可靠性差、价值密  度低 等问题,一方面,在钻井过程中随时可能遇到不同的地质条件,如岩性、地  层压力的变化等 复杂多变因素,导致事故频发。当事故发生时,通常会使得多个  钻进过程参数出现上升或 下降的趋势,从而脱离正常值;另一方面,由于井下环  境恶劣、设备工作不稳定等原因,传 感器损坏或灵敏度下降,检测值可能会产生  突变导致量测误差,数据出现异常。两种类型 的异常值在钻进过程中混合出现, 因此,如何快速有效的检测判断出钻进离群点数据中由 于测量失误导致的异常值,  并进行校核,对于钻进过程的控制、状态监测等来说具有重要 意义。 本发明提出了一种基于动态时间规整的钻进过程数据异常判别与校正方法,  实 现钻进过程中异常值检测及产生原因的判断,从而在保留数据特性的同时,能  够对由外界 因素导致的异常值进行校正,以保证钻进过程数据的可靠性。
技术实现要素:
钻进过程中事故频发,通常有两方面的原因导致钻进过程数据异常,一方面  是由 于传感检测误差等外界因素导致数据异常,另一方面是发生钻井事故时,数  据出现异常。 为了解决上述问题,在钻进过程中得到钻进过程数据,根据事故发  生时一般有两个或以上 参数发生相同趋势变化(上升或下降)的特性,使用本发  明提供了一种基于动态时间规整 的钻进过程数据异常判别与校正的方法完成数  据异常判别与校正,该方法主要包括以下 步骤: S1:采用马氏距离对所述钻进过程数据进行离群点数据检测,得到一个由  若干离 4 CN 111598129 A 说 明 书 2/7 页 群点数据形成的集合; S2:以该集合中各个离群点数据为中心,使用DTW算法计算一定长度p 内两个时间 序列间的最小距离dtwu;其中,p为大于零的正数;两个时间序列的  选择原则为:在发生事 故时的变化趋势相类似,即数据变化趋势为同时上升或同 时下降; S3:基于模糊C均值聚类算法对计算得到的dtwu值进行聚类划分,得到若  干类别; 根据正常钻进时与上述同样长度时间序列内的dtwp值,计算所述若干  类别的不同聚类中 心与该dtwp值的距离lk,并结合异常敏感系数q,1≤q≤1.5,  判断lk是否大小qlmin;若是,则 第k类聚类中离群点数据是由于检测误差引起的  异常值;若否,则该离群点数据由是于钻 进事故引起的异常值;其中,k为大于  零的正整数,表示聚类类别;lmin为聚类中心与dtwp值 间的最小的欧式距离; S4:使用K近邻算法对由于检测误差引起的异常离群点数据进行处理,选  取距离 异常离群点数据最近的K个邻居的平均值,以替换该异常离群点数据进  行校核,并将校核 后的数据保存到历史数据库中;K为大于0的正数。 进一步地,对钻进过程数据进行离群点数据检测的具体过程如下: (1-1):X={xi|i=1,2,…,M}表示钻进过程数据的集合,其中M表示钻进过  程相 关数据的总数量;采用如下所示的马氏距离对钻进过程数据X进行离群点 数据检测: 其中,x 表示第i个钻进过程数据,T表示转置,Σ-1i 表示钻进过程数据xi与整  个时 间序列内数据平均值u的协方差矩阵; (1-2):对步骤(1-1)中检测得到的马氏距离进行降序排序,若所述钻进  过程数据 xi处的马氏距离di小于dset值,则xi为正常数据,其中,dset为设置的  某一序号i处的马氏距 离的阀值;若所述钻进过程数据xi处的马氏距离di大于等  于dset值,则xi为离群点数据xu。 进一步地,使用DTW算法计算长度p内两个时间序列间距离的过程如下: 若这两个时间序列为P和Q,分别表示钻进过程中发生事故时有相同变化趋  势的 两个参数,计算以离群点数据为中心,p时间长度区间内时间序列的相似性,  两个时间序列 P和Q的长度分别为a和b,根据如下公式得到最小动态时间规整  距离dtwu: γ(i,j)=e(pi,qj) min{γ(i-1,j) γ(i-1,j-1) γ(i,j-1)} 其中,e(pi,qj)是pi和qj两个数据点的距离,γ(i,j)是累积距离,从(0,0)点开  始 匹配两个序列P和Q,每到一个点,之前所有点计算的距离都会累积为γ(i,j);  最终到(a, b)点处的γ(i,j)值为最小动态时间规整距离dtwu。 进一步地,基于模糊C均值聚类算法对计算得到的DTW值dtwu进行聚类  划分的过 程如下: 设定核模糊C均值聚类算法的目标函数Jm如下: 5 CN 111598129 A 说 明 书 3/7 页 其中,Jm是模糊C均值聚类算法的目标函数,K是聚类个数,N是离群点检测  数据的 样本数目,m是模糊指数,μku是离群点数据xu相对于聚类中心ck的隶属  度, 表示控制聚类 过程中的模糊性,dtwu表示第k类中的离群点数据,ck和cf分别表示第k类与第f类的聚类中 心;通过更新聚类中心ck和模糊隶属度μku来 实现Jm的最小。 进一步地,通过以下公式分别计算聚类中心ck与正常钻进时p长度时间序  列内的 DTW值dtwp的欧式距离: lk=||ck-dtwp|| 其中,lk为聚类中心ck与正常钻进时p长度时间序列DTW值dtwp的欧式距  离;通过 比较得到的所有欧式距离,找到最小的欧式距离lmin,根据异常敏感系  数q,当距离lk大于 qlmin时,判定第k类聚类中离群点数据是由于检测误差引起 的异常值,反之是由于钻进事 故引起的异常值。 本发明提供的技术方案带来的有益效果是:能够保证钻进过程检测数据的可  靠 性,为钻进过程控制、状态监测方面的研究奠定基础,具有实用性和适用性。 附图说明 下面将结合附图及实施例对本发明作进一步说明,附图中: 图1是本发明实施例中一种基于动态时间规整的钻进过程数据异常判别与  校正 的方法的流程图; 图2是本发明实施例中动态时间规整(DTW)算法原理示意图。
下载此资料需消耗2积分,
分享到:
收藏