技术摘要:
本发明说明书提供一种基于聚类耦合确定变权区间阈值的方法、装置、设备及介质,其中的方法包括:数据采集、量化和归一化处理;主成分分析确定综合评价指数;对综合评价指数进行K均值聚类;变权区间阈值的确定。本发明首次提出了应用主成分分析法与K均值聚类耦合的方法 全部
背景技术:
我国是一个煤矿资源相对丰富,石油和天然气相对匮乏的国家,同时,也是世界上 产煤能力最强的国家之一。如今,随着浅部煤层基本开采完毕,煤层开采逐步加深以及其他 开采条件的变化,由水害引发的煤炭开采事故的频率越来越高,造成的人员伤亡愈来愈多, 因此保证煤矿开采的安全的关键性问题就在于煤矿水灾害的解决,对矿井水灾害进行预防 和治理具有明显的现实意义,从长远看,也是煤炭安全开采的战略目标。 基于以上原因,中国矿业大学(北京)武强教授早在上世纪九十年代末就致力于研 究基于多源信息集成理论和“环套理论”,并采用具有强大空间数据统计分析处理功能的地 理信息系统(GIS)与线性或非线性数学方法的集成技术,对煤层底板突水进行了研究,并于 近期提出了利用基于变权模型的脆弱性指数法对煤层底板突水进行预测评价方法。中国矿 业大学(北京)武强教授和李博在2014年提出运用状态变权向量公式对各主控因素依次分 类确定煤层底板突水变权区间阈值,此方法有效的反映了各主控因素在煤层底板突水问题 中的变化规律。此次首次提出基于主成分分析法与K均值聚类耦合的方法确定煤层底板突 水变权区间的阈值,消除各因素彼此之间的影响,以及减少计算的工作量。 在应用变权模型对煤层底板突水危险性进行预测评价时,需要首先确定各主控因 素的变权区间,然后对不同的区间采用对应的“激励”“、惩罚”机制对其权重进行调节。然而 变权模型中的变权区间阈值的确定是该技术的一个难点,目前尚无统一的分析确定方法。
技术实现要素:
有鉴于此,本说明书一个或多个实施例的目的在于提出一种基于聚类耦合确定变 权区间阈值的方法、装置、设备及介质,能有效地提高煤层底板突水脆弱性评价预测的精度 并减少工作量。 基于上述目的,本说明书一个或多个实施例提供了一种基于聚类耦合确定变权区 间阈值的方法,首先确定各主控因素,还包括以下步骤: A、数据采集、量化和归一化处理; B、主成分分析确定综合评价指数,运用主成分分析法对各主控因素进行降维处 理,提取主成分因子计算主成分因子的贡献率,进而计算综合评价指数,包括: B1、计算相关系数矩阵R及KMO检验系数; 5 CN 111598384 A 说 明 书 2/17 页 B2、计算特征值与特征向量; 根据特征方程|λI-R|=0求解特征值和特征向量,其中,λ为特征值, I为原数据矩 阵,R为相关系数矩阵; B3、计算主成分因子的贡献率和累计贡献率; 贡献率: 累计贡献率: 式中,p为选取的主成分数目; B4、计算主成分载荷; 式中,e为单位特征向量; B5、计算各主成分得分及综合评价指数; Fi=λ1ix1 λ2ix2 … λpixp i=1,2,…,m 式中,Fi为第i个公共因子向量,x为主成分因子载荷; 计算评价指数: Y=λ1iF1 λ2iF2 … λpiFp i=1,2,…,m Y为综合评价指数; C、对综合评价指数进行K均值聚类; D、变权区间阈值的确定。 结合上述说明,在本发明实施例另一种可能的实施方式中,所述步骤A 中,数据采 集、量化和归一化处理是根据矿区地质勘探钻孔、地质构造、抽水试验和采矿资料,采集主 控因素原始数据,并对数据进行量化和归一化处理。 结合上述说明,在本发明实施例另一种可能的实施方式中,所述所述步骤A中,对 采集、量化的数据进行归一化处理的表达如下: 式中:Ai为归一化处理后的数据,a、b分别归一化范围的下限和上限,分别取0和1, min(xi)和max(xi)分别为各主控因素量化值的最小值和最大值。 结合上述说明,在本发明实施例另一种可能的实施方式中,所述步骤C 中对综合 评价指数进行K均值聚类,具体包括以下步骤: C1、按照K-means算法选择迭代分类,确定K-means算法的迭代次数为 10; 确定分类类别为4类; C2、对综合评价指数值进行动态聚类运算,直到迭代稳定; C3、根据分类结果确定综合评价指数值分类临界值。 结合上述说明,在本发明实施例另一种可能的实施方式中,所述步骤D 中,变权区 间阈值的确定表达如下: d1=(f1 f2)/2;d2=(f3 f4)/2;d3=(f5 f6)/2; 6 CN 111598384 A 说 明 书 3/17 页 式中:di为第i个综合评价指数值的变权区间阈值。 第二方面,本发明实施例还提供了一种基于聚类耦合确定变权区间阈值的装置, 所述装置包括: 数据处理模块,用于数据采集、量化和归一化处理; 降维处理模块,用于通过主成分分析确定综合评价指数,运用主成分分析法对各 主控因素进行降维处理,提取主成分因子计算主成分因子的贡献率,进而计算综合评价指 数,包括: 第一计算子模块,用于计算相关系数矩阵R及KMO检验系数; 第二计算子模块,用于计算特征值与特征向量; 根据特征方程|λI-R|=0求解特征值和特征向量,其中,λ为特征值, I为原数据矩 阵,R为相关系数矩阵; 第三计算子模块,用于计算主成分因子的贡献率和累计贡献率; 贡献率: 累计贡献率: 式中,p为选取的主成分数目; 第四计算子模块,用于计算主成分载荷; 式中,e为单位特征向量; 第五计算子模块,用于计算各主成分得分及综合评价指数; Fi=λ1ix1 λ2ix2 … λpixp i=1,2,…,m 式中,Fi为第i个公共因子向量,x为主成分因子载荷; 计算评价指数: Y=λ1iF1 λ2iF2 … λpiFp i=1,2,…,m Y为综合评价指数; 聚类模块,用于对综合评价指数进行K均值聚类; 确定模块,用于确定变权区间阈值。 上述的装置所述数据处理模块的数据采集、量化和归一化处理是根据矿区地质勘 探钻孔、地质构造、抽水试验和采矿资料,采集主控因素原始数据,并对数据进行量化和归 一化处理。 上述的装置,所述数据处理模块,对采集、量化的数据进行归一化处理的表达如 下: 7 CN 111598384 A 说 明 书 4/17 页 式中:Ai为归一化处理后的数据,a、b分别归一化范围的下限和上限,分别取0和1, min(xi)和max(xi)分别为各主控因素量化值的最小值和最大值。 第三方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存 储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述基于聚类 耦合确定变权区间阈值的方法。 第四方面,本发明实施例还提供了一种非暂态计算机可读存储介质,所述非暂态 计算机可读存储介质存储计算机指令,所述计算机指令用于使所述计算机执行所述基于聚 类耦合确定变权区间阈值的方法。 从上面所述可以看出,本说明书一个或多个实施例提供的基于聚类耦合确定变权 区间阈值的方法、装置、设备及介质,由于在确定各主控因素的基础上,依次进行数据采集、 量化和归一化处理;主成分分析确定综合评价指数;对综合评价指数进行K均值聚类;变权 区间阈值的确定等步骤,首次提出了应用主成分分析法与K均值聚类耦合的方法进行煤层 底板脆弱性评价预测中的变权区间阈值的确定方法,该方法根据煤层底板突水各主控因素 指标值在空间分布上存在差异,同时也具有一定的相似性的特征,运用主成分分析法提取 各主控因素的主成分因子,进而计算主成分因子的综合评价指数值,利用统计分析手段有 效的对综合评价指数进行K均值聚类,然后根据分类的临界值求取变权区间阈值,从而利用 对应的“激励”、“惩罚”措施对其权重进行调节。使用该方法确定变权区间阈值的方法简化 变权阈值的计算过程,同时考虑了多种主控因素之间的相互影响,方法合理,符合生产实 际,能有效的提高煤层底板突水脆弱性评价预测的精度。 附图说明 为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将 对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的 附图仅仅是本说明书一个或多个实施例,对于本领域普通技术人员来讲,在不付出创造性 劳动的前提下,还可以根据这些附图获得其他的附图。 图1为本发明实施例提供的基于聚类耦合确定变权区间阈值的方法的工作流程 图; 图2为本发明实施例提供的基于聚类耦合确定变权区间阈值的方法的具体实施时 的工作流程图; 图3为本发明实施例中煤层底板隔水层承受的底板灰岩水压专题图; 图4为本发明实施例中煤至底板灰岩有效隔水层等效厚度专题图; 图5为本发明实施例中煤至底板灰岩矿压破坏带下脆性岩厚度专题图; 图6为本发明实施例中底板灰岩含水层富水性专题图; 图7为本发明实施例中煤断层规模指数专题图; 图8为本发明实施例中煤断层与褶皱分布专题图; 图9(a)为本发明实施例中煤断层与褶皱交端点专题图; 图9(b)为本发明实施例中煤断层与褶皱交端点专题图局部放大图; 8 CN 111598384 A 说 明 书 5/17 页 图10为本发明实施例中基于变权模型的底板突水脆弱性评价分区图。 图11为本发明实施例提供的基于聚类耦合确定变权区间阈值的装置的结构示意 图; 图12为本说明书一个或多个实施例的电子设备结构示意图;