技术摘要:
一种基于聚类算法的岩土层智能分层方法,包括:将岩土层技术指标参数中进行归一化处理;包括:先将岩土层技术指标参数中的非数值型指标进行数值化处理,然后将所有数值型指标进行数量级差异修正,得到了归一化的分层技术指标值;将岩土层技术指标参数进行权重化处理, 全部
背景技术:
工程勘察的工作流程可以分为外业工作和内业工作两个部分。外业工作是在实际 工程场地上实施勘探作业并取得一手的原始勘探资料(主要是钻孔资料),内业工作则是对 这些原始资料进行整理加工形成可用的成果资料。在内业工作中,最核心的一个步骤是分 层即岩土层的划分,将工程场地内的岩土体按照地质年代和工程性质的不同划分为若干个 分组,便于工程计算和设计。 目前主流的分层方法可以概括为如下几个步骤: 整理每个钻孔的原始数据,形成初始的局部分层; 手动比对每个钻孔的局部分层,归纳总结出一套全局分层; 遍历每个钻孔,根据对应关系将钻孔内的每个局部分层转化为全局分层。 整理资料,最终每个钻孔都有一套全局分层表。 这套方法简单来说就是由技术人员手动对原始勘探资料进行统计、分析和归类。 无数工程实践证明,这套方法存在较大的缺陷,主要表现在以下几个方面: 分层工作的效率低,耗费时间长,特别是钻孔数量较多的工程,有时需要耗费数周 乃至数月的时间; 分层过程中容易出现人为错误; 分层结果准确度低,容易出现冲突和错误。 引起这些缺陷的核心原因在于整个方法的流程是全手动的。岩土层的划分,本质 上是将每个钻孔的初始分层进行归类和分组,划分到同一组的局部分层应当具有相近的物 理力学性质和工程性质。因此,分层工作就是一系列的统计、归纳和分组操作。技术人员需 要将每个钻孔的局部分层进行遍历,分析它们的各项数据,评估它们之间的相似程度,然后 总结出一套全局分组,最后将每个局部分层归入到一个全局分组中,从而完成分层工作。在 这个过程中,有大量的统计分析工作,这些数学上的操作完全由技术人员手动完成。另外, 具体该使用何种统计分析方法、选用哪些技术指标进行统计,也没有统一的标准和规定,导 致不同技术人员的分层成果可能千差万别。 在分层时,技术人员还面临一个棘手的问题,那就是岩土层的各项工程指标的类 型和单位不同,难以用准确的数学模型衡量它们之间的差异性。有的指标值是连续的数值 型指标,有的指标是非连续的数值型指标,还有的指标是离散的非数值型指标。技术人员需 要综合考虑这些技术指标,分析不同类型指标之间的差异程度,以此判定它们能否划分为 同一组分层。由于这个“差异程度”无法用数学来表达,所以分层工作只能依赖于定性的分 析。这造成了一个现状——长期以来,技术人员都是以“工程经验”来衡量分层指标之间的 差异程度的,两个局部分层能否分为一组,几乎完全依赖于经验。 4 CN 111582379 A 说 明 书 2/7 页 分析过程由技术人员手动进行,分析标准由技术人员的经验确定,这就导致了分 层工作成为了一项既困难又易错的工作。特别是对于地质条件复杂、勘探工作量大的工程 项目,分层已成为整个勘察工作流程中最大的痛点和难点。
技术实现要素:
鉴于上述问题,提出了本发明提供一种克服上述问题或者至少部分地解决上述问 题的一种基于聚类算法的岩土层智能分层方法和系统。 为了解决上述技术问题,本申请实施例公开了如下技术方案: 一种基于聚类算法的岩土层智能分层方法,包括: S100.将岩土层技术指标参数中进行归一化处理;包括:先将岩土层技术指标参数 中的非数值型指标进行数值化处理,然后将所有数值型指标进行数量级差异修正,得到了 归一化的分层技术指标值; S200.将岩土层技术指标参数进行权重化处理,具体为:对分层影响程度大的技术 指标赋予较大的权重系数,影响程度小的技术指标赋予较小的权重系数; S300.利用进行归一化和权重化处理后可供计算的修正后指标值,通过K-Means算 法进行聚类计算,实现岩土层智能分层目的。 进一步地,S300包括: S301 .根据岩土层层数确定分层层数K值,随机初始化K个修正后指标值作为中心 点; S302.将每一个修正后指标值与中心点进行距离计算,选取距离最近的中心点作 为当前分层层数类别; S303.将所有修正后指标值进行聚类后,将每一类平均点重新设置为该类别中所 有修正后指标值的新中心点,重新计算每一个修正后指标值与新中心点距离; S304.当修正后指标值与新中心点距离小于预设阈值时,则聚类成功;当修正后指 标值与新中心点距离大于预设阈值时,重复S302-S303,直至修正后指标值与新中心点距离 小于预设阈值。 进一步地,所述距离的计算,将所有指标经过归一化和权重化之后的差值相加,得 到总差值,用这个总差值来表达局部分层之间的距离。 进一步地,所述平均值的计算,本是将分层的各项指标求得其平均值,组合起来构 造一个平均分层。 进一步地,对于分层的各项数值型和非数值型指标采用不同的计算方式,具体为: 数值型指标直接取算术平均值即可,非数值型指标取统计样本数最多的值。 进一步地,岩土层技术指标参数中的非数值型指标包括:地质描述中的土的塑性 状态、密实度、湿度。 本发明还公开了一种基于聚类算法的岩土层智能分层系统,包括:归一化模块、权 重化模块、聚类算法模块,具体的: 归一化模块,用于将岩土层技术指标参数中进行归一化处理;包括:先将岩土层技 术指标参数中的非数值型指标进行数值化处理,然后将所有数值型指标进行数量级差异修 正; 5 CN 111582379 A 说 明 书 3/7 页 权重化模块,用于将岩土层技术指标参数进行权重化处理,具体为:对分层影响程 度大的技术指标赋予较大的权重系数,影响程度小的技术指标赋予较小的权重系数; 聚类算法模块,用于将归一化和权重化处理后可供计算的修正后指标值,通过K- Means算法进行聚类计算,实现岩土层智能分层目的。 进一步地,聚类算法模块具体聚类方法为: S301 .根据岩土层层数确定分层层数K值,随机初始化K个修正后指标值作为中心 点; S302.将每一个修正后指标值与中心点进行距离计算,选取距离最近的中心点作 为当前分层层数类别; S303.将所有修正后指标值进行聚类后,将每一类平均点重新设置为该类别中所 有修正后指标值的新中心点,重新计算每一个修正后指标值与新中心点距离; S304.当修正后指标值与新中心点距离小于预设阈值时,则聚类成功;当修正后指 标值与新中心点距离大于预设阈值时,重复S302-S303,直至修正后指标值与新中心点距离 小于预设阈值。 进一步地,所述距离的计算,将所有指标经过归一化和权重化之后的差值相加,得 到总差值,用这个总差值来表达局部分层之间的距离。 进一步地,所述平均值的计算,本是将分层的各项指标求得其平均值,组合起来构 造一个平均分层。 本发明实施例提供的上述技术方案的有益效果至少包括:本发明提出了一种基于 聚类算法的岩土层智能分层方法,对岩土层技术指标参数的归一化和权重化处理,得到了 可供计算的修正后指标值,利用可供计算的修正后指标值,通过K-Means算法进行聚类计 算,实现岩土层智能分层目的。本发明能大幅提高分层工作的效率。本专利技术用计算机算 法代替了人工计算,在效率上有飞跃性的提升。能保证分层过程中不出现人为错误。本专利 技术运用了成熟的机器学习算法,计算过程得到了数学上的保证,不会出现人工方法中常 出现的人为错误。通过机器学习算法将人工过程转化为计算机过程,通过岩土指标归一化 技术将非数学的指标转化为数学指标,从而使整个工作流程转化为数学计算过程,得到的 结果的准确度也有数学上的保障。 下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。 附图说明 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实 施例一起用于解释本发明,并不构成对本发明的限制。在附图中: 图1为本发明实施例1中,一种基于聚类算法的岩土层智能分层方法流程图; 图2为本发明实施例1中,K-means聚类算法流程图;