logo好方法网

集群优化方法、装置、服务器及介质


技术摘要:
本发明提供一种集群优化方法、装置、服务器及介质。所述集群优化方法能够采集预设时间内至少一个云环境中所有集群的监控数据,对每个集群的监控数据进行归一化处理,得到每个集群的至少一种指标项,根据所述至少一种指标项,计算每个集群的稳定性及每个集群的使用率,  全部
背景技术:
目前,随着云计算的快速发展,云计算的应用领域也随之拓宽,进而使应用的类型 也增多,根据需要,不同应用将被部署在不同云环境的集群上。 然而,在现有的技术方案中,无法针对云环境下集群出现的故障进行相应的处理, 此外,当不同云环境下的集群出现相同故障时,也无法进行统一处理。
技术实现要素:
鉴于以上内容,有必要提供一种集群优化方法、装置、服务器及介质,不仅能够针 对云环境下集群出现的故障进行相应的处理,而且当不同云环境下的集群出现相同故障 时,还能够对该故障进行统一处理。 一种集群优化方法,所述方法包括: 采集预设时间内至少一个云环境中所有集群的监控数据; 对每个集群的监控数据进行归一化处理,得到每个集群的至少一种指标项; 根据所述至少一种指标项,计算每个集群的稳定性及每个集群的使用率; 根据每个集群的稳定性及每个集群的使用率,确定异常集群以及所述异常集群的 异常类型; 根据所述异常类型处理所述异常集群。 根据本发明优选实施例,在采集预设时间内至少一个云环境中所有集群的监控数 据之前,所述方法还包括: 获取所述预设时间内所述所有集群的告警信息; 对所述告警信息进行分词处理,得到多个第一信息; 清洗所述第一信息,得到多个第二信息; 采用TF-IDF算法计算所述多个第二信息的概率; 根据所述多个第二信息的概率确定所述监控数据。 根据本发明优选实施例,所述根据所述至少一种指标项,计算每个集群的稳定性 及每个集群的使用率包括: 根据公式一计算每个集群的稳定性,所述公式一为: 其中,S表示集群的稳定性,a表示1级告警的危险系数,x表示1级告警的数量,b表 示2级告警的危险系数,y表示2级告警的数量,c表示3级告警的危险系数,z表示3级告警的 数量,m表示集群中实例的总数量; 根据公式二计算每个集群的使用率,所述公式二为: 4 CN 111581044 A 说 明 书 2/14 页 其中,U表示集群的使用率,ni表示第i个实例的利用率,i∈{1,2,3,…,m}(m∈ N*)。 根据本发明优选实施例,所述根据每个集群的稳定性及每个集群的使用率,确定 异常集群以及所述异常集群的异常类型包括以下一种或者多种方式的组合: 对于每个集群中的任意集群,获取该集群的稳定性及除该集群以外的其余集群的 平均稳定性,将所述平均稳定性乘以第一预设比例,得到第一数值,当该集群的稳定性小于 所述第一数值时,将该集群确定为第一集群,所述第一集群属于稳定性异常类型的异常集 群;及/或 对于每个集群中的任意集群,获取该集群的使用率及除该集群以外的其余集群的 平均使用率,将所述平均使用率乘以第二预设比例,得到第二数值,以及将所述平均使用率 乘以第三预设比例,得到第三数值,当该集群的使用率小于所述第二数值或者大于所述第 三数值时,将该集群确定为第二集群,所述第二集群属于使用率异常类型的异常集群。 根据本发明优选实施例,所述根据所述异常类型处理所述异常集群包括以下一种 或者多种方式的组合: 提取所述第一集群中的异常日志,从配置方案中获取与所述异常日志匹配的目标 方案,以所述目标方案处理所述第一集群;及/或 根据所述第二集群的使用率,确定所述第二集群中实例数的变化量,根据所述变 化量处理所述第二集群。 根据本发明优选实施例,所述根据所述第二集群的使用率,确定所述第二集群中 实例数的变化量包括: 获取所述第二集群中实例的第一数量; 将所述第二集群的使用率乘以所述第一数量后,除以所述平均使用率,得到所述 第二集群中实例的第二数量; 将所述第二数量与所述第一数量进行相减运算,得到所述变化量。 根据本发明优选实施例,在根据所述异常类型处理所述异常集群之后,所述方法 还包括: 测试所述异常集群,得到测试结果; 当所述测试结果为测试不通过时,根据所述测试结果生成目标信息; 采用高级加密标准算法加密所述目标信息,得到目标密文; 将所述目标密文发送至指定联系人的终端设备。 一种集群优化装置,所述装置包括: 采集单元,用于采集预设时间内至少一个云环境中所有集群的监控数据; 处理单元,用于对每个集群的监控数据进行归一化处理,得到每个集群的至少一 种指标项; 计算单元,用于根据所述至少一种指标项,计算每个集群的稳定性及每个集群的 使用率; 确定单元,用于根据每个集群的稳定性及每个集群的使用率,确定异常集群以及 5 CN 111581044 A 说 明 书 3/14 页 所述异常集群的异常类型; 所述处理单元,还用于根据所述异常类型处理所述异常集群。 根据本发明优选实施例,所述装置还包括: 获取单元,用于在采集预设时间内至少一个云环境中所有集群的监控数据之前, 获取所述预设时间内所述所有集群的告警信息; 所述处理单元,还用于对所述告警信息进行分词处理,得到多个第一信息; 清洗单元,用于清洗所述第一信息,得到多个第二信息; 所述计算单元,还用于采用TF-IDF算法计算所述多个第二信息的概率; 所述确定单元,还用于根据所述多个第二信息的概率确定所述监控数据。 根据本发明优选实施例,所述计算单元根据所述至少一种指标项,计算每个集群 的稳定性及每个集群的使用率包括: 根据公式一计算每个集群的稳定性,所述公式一为: 其中,S表示集群的稳定性,a表示1级告警的危险系数,x表示1级告警的数量,b表 示2级告警的危险系数,y表示2级告警的数量,c表示3级告警的危险系数,z表示3级告警的 数量,m表示集群中实例的总数量; 根据公式二计算每个集群的使用率,所述公式二为: 其中,U表示集群的使用率,ni表示第i个实例的利用率,i∈{1,2,3,…,m}(m∈ N*)。 根据本发明优选实施例,所述确定单元根据每个集群的稳定性及每个集群的使用 率,确定异常集群以及所述异常集群的异常类型包括以下一种或者多种方式的组合: 对于每个集群中的任意集群,获取该集群的稳定性及除该集群以外的其余集群的 平均稳定性,将所述平均稳定性乘以第一预设比例,得到第一数值,当该集群的稳定性小于 所述第一数值时,将该集群确定为第一集群,所述第一集群属于稳定性异常类型的异常集 群;及/或 对于每个集群中的任意集群,获取该集群的使用率及除该集群以外的其余集群的 平均使用率,将所述平均使用率乘以第二预设比例,得到第二数值,以及将所述平均使用率 乘以第三预设比例,得到第三数值,当该集群的使用率小于所述第二数值或者大于所述第 三数值时,将该集群确定为第二集群,所述第二集群属于使用率异常类型的异常集群。 根据本发明优选实施例,所述处理单元根据所述异常类型处理所述异常集群包括 以下一种或者多种方式的组合: 提取所述第一集群中的异常日志,从配置方案中获取与所述异常日志匹配的目标 方案,以所述目标方案处理所述第一集群;及/或 根据所述第二集群的使用率,确定所述第二集群中实例数的变化量,根据所述变 化量处理所述第二集群。 根据本发明优选实施例,所述处理单元根据所述第二集群的使用率,确定所述第 6 CN 111581044 A 说 明 书 4/14 页 二集群中实例数的变化量包括: 获取所述第二集群中实例的第一数量; 将所述第二集群的使用率乘以所述第一数量后,除以所述平均使用率,得到所述 第二集群中实例的第二数量; 将所述第二数量与所述第一数量进行相减运算,得到所述变化量。 根据本发明优选实施例,所述装置还包括: 测试单元,用于在根据所述异常类型处理所述异常集群之后,测试所述异常集群, 得到测试结果; 生成单元,用于当所述测试结果为测试不通过时,根据所述测试结果生成目标信 息; 加密单元,用于采用高级加密标准算法加密所述目标信息,得到目标密文; 发送单元,用于将所述目标密文发送至指定联系人的终端设备。 一种服务器,所述服务器包括: 存储器,存储至少一个指令;及 处理器,执行所述存储器中存储的指令以实现所述集群优化方法。 一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所 述至少一个指令被服务器中的处理器执行以实现所述集群优化方法。 由以上技术方案可以看出,本发明不仅能够针对云环境下集群出现的故障进行相 应的处理,而且当不同云环境下的集群出现相同故障时,还能够对该故障进行统一处理。 附图说明 图1是本发明集群优化方法的较佳实施例的流程图。 图2是本发明集群优化装置的较佳实施例的功能模块图。 图3是本发明实现集群优化方法的较佳实施例的服务器的结构示意图。
下载此资料需消耗2积分,
分享到:
收藏