logo好方法网

一种业务指标监控方法、监控服务器和系统


技术摘要:
本发明公开了一种业务指标监控方法,适于在监控服务器中执行,监控服务器分别与时序数据库和网站服务器通信连接,该方法包括步骤:从网站服务器中获取各监控项目的第一配置文件来生成对应的定时监控任务,该第一配置文本至少包括监控名称和对应的监控表达式,该监控表  全部
背景技术:
随着业务系统的增多、功能迭代越加频繁,服务上线后出现的问题也随之增多,如 何能够第一时间发现问题成为业务系统的关键。而对业务数据的监控将会是一种有效手 段,能第一时间发现线上问题及时止损。但现有的开源监控系统多以运维监控功能为主,并 不完全适用于业务监控场景。比较常用的开源监控系统如Zabbix、Prometheus、Nagios等, 通常为C/S架构。C即为客户端,安装在被监控的服务器上,主动采集主机指标上传到监控服 务器端。这些监控系统主要是给运维人员使用,监控主机状态及服务状态。比如CPU占用率、 内存占用率、磁盘空间、端口服务能否访问等运维层面的关注点,而业务数据指标相对于运 维指标属于更高层次,运维监控并不适用。另一方面,监控规则的配置也只适用于单指标的 形式,对应一些复杂的业务监控需要考虑多个指标的数据一致性或关联性时就无法满足需 求。 因此,需要提供一种更有效的业务数据的监控方法。
技术实现要素:
鉴于上述问题,本发明提出了一种业务指标监控、监控服务器和系统,以力图解决 或者至少解决上面存在的问题。 根据本发明的一个方面,提供了一种业务指标监控方法,适于在监控服务器中执 行,监控服务器分别与时序数据库和网站服务器通信连接,时序数据库中存储有从多种数 据来源中采集到的监控指标值,该方法包括步骤:从网站服务器中获取各监控项目的第一 配置文件来生成对应的定时监控任务,第一配置文本至少包括监控名称和对应的监控表达 式,监控表达式包括告警条件和至少一个指标项,每个指标项包括监控指标和至少一个过 滤条件,且多个指标项用数学运算符连接;当某监控项目的定时监控任务触发时,根据所述 监控表达式中各监控指标的过滤条件从所述时序数据库中获取对应的指标值,代入到该监 控表达式中,以判断该监控表达式是否成立;以及若监控表达式成立,则生成告警信息,并 发送告警通知。 可选地,在根据本发明的业务指标监控方法中,监控表达式包括以下任意一种:单 个指标的阈值表达式,包括该指标的指标项和告警条件;单个指标的同比/环比表达式,包 括该指标的第一指标项、第二指标项和告警条件;以及多个指标的对比表达式,包括第一指 标的指标项、第二指标的指标项和告警条件。 可选地,在根据本发明的静态资源上传方法中,过滤条件包括针对统计方法的第 一过滤条件和针对数据选择的第二过滤条件;第一过滤条件包括取最大值、取最小值、取平 均值、取中间值、取总值和取最新值中的至少一种;第二过滤条件包括统计时长、比较时间、 延迟时间和标签聚合中的至少一种。 4 CN 111553560 A 说 明 书 2/10 页 可选地,在根据本发明的业务指标监控方法中,数学运算符包括“ ”、“-”、“×”、 “/”中的至少一种;告警条件包括比较符号和告警阈值,比较符号包括“<”、“>”、“≤”、 “≥”、“=”中的至少一种。 可选地,在根据本发明的业务指标监控方法中,还包括生成各监控项目的监控表 达式的步骤:获取监控需求文本,从中至少提取监控周期、运算类型、比较类型、告警阈值、 所需要的监控指标和各监控指标的过滤条件,并确定所述运算类型对应的数据运算符,以 及所述比较类型对应的比较符号;将各监控指标及其对应的过滤条件作为一个指标项,多 个指标项之间用所确定的数学运算符连接,并加上所确定的比较符号和告警阈值,得到对 应的监控表达式。 可选地,在根据本发明的业务指标监控方法中,网站服务器与监控配置平台通信 连接,所述监控配置平台分别设置有监控周期选项框、监控指标选项框、统计方法选项框、 运算符号选项框、数据选择选项框、比较符号选项框和告警阈值输入框,以便用户在各选项 框中进行选择后生成对应的监控表达式。 可选地,在根据本发明的业务指标监控方法中,还包括将各监控指标值存入时序 数据库的步骤:获取各监控项目的第二配置文件,第二配置文件包括各监控项目所需的监 控指标、以及每种监控指标的数据来源、指标采集方法和采集间隔;对于每一监控项目,按 照所述采集间隔定时从对应的数据来源采集所需要的监控数据,计算得到监控指标后存入 所述时序数据库中。 可选地,在根据本发明的业务指标监控方法中,第一配置文件还包括监控周期、告 警通知方式和通知人员列表;第二配置文件中包括多个业务标签的监控指标,以便针对每 种业务标签进行标签聚合后得到对应的指标值;第二配置文件还包括每个监控指标的关联 维度,关联维度至少包括地域、品牌和系统。 可选地,在根据本发明的业务指标监控方法中,数据来源包括Mysql数据库、大数 据平台、Flink实时计算平台和Kafka消息队列中的至少一种。 根据本发明的另一方面,提供了一种监控服务器,分别与时序数据库和网站服务 器通信连接,时序数据库中存储有从多种数据来源中采集到的监控指标值,监控服务器包 括:调度器,适于从网站服务器中获取各监控项目的第一配置文件来生成对应的定时监控 任务,第一配置文本至少包括监控名称和对应的监控表达式,该监控表达式包括告警条件 和至少一个指标项,每个指标项包括监控指标和过滤条件,且多个指标项用数学运算符连 接;规则引擎,适于当某监控项目的定时监控任务触发时,根据该监控项目的监控表达式中 各监控指标的过滤条件从时序数据库中获取对应的指标值,代入到该监控表达式中,以判 断该监控表达式是否成立;以及告警器,适于当监控表达式成立时,生成告警信息,并发送 告警通知。 根据本发明的另一方面,提供了一种业务指标监控系统,包括:网站服务器,适于 生成监控项目的第一配置文件;时序数据库,适于存储从多种数据来源采集到的多种监控 指标值;以及如上所述的监控服务器,适于根据第一配置文件生成定时监控任务,并当定时 监控任务触发时,从时序数据库中获取对应的指标值,代入到第一配置文件的监控表达式 中,以判断是否输出告警信息。 根据本发明的又一方面,提供了一种服务器,包括:一个或多个处理器;存储器;以 5 CN 111553560 A 说 明 书 3/10 页 及一个或多个程序,其中一个或多个程序存储在存储器中并被配置为由一个或多个处理器 执行,该一个或多个程序被处理器执行时实现如上所述的业务指标监控方法的步骤。 根据本发明的又一方面,提供了一种存储一个或多个程序的计算机可读存储介 质,该一个或多个程序包括指令,所述指令当由服务器执行时实现如上所述的业务指标监 控方法的步骤。 根据本发明的技术方案,提供了一种针对业务指标的监控方法和自定义监控规则 专有语言,提供丰富配置监控规则,支持单个业务指标或多个指标间的灵活计算,做到实时 计算实时监控。本发明适配多种业务场景。通过采集不同来源的数据转化为业务指标,比如 数据库、大数据平台、实时计算平台等,再通过监控系统配置监控规则,可满足多种复杂业 务场景。而且,本发明针对单个指标提供了阈值类型和比较类型的告警规则配置。针对多个 指标相互间计算的情况提供了更加灵活的自定义配置方法。当单个指标不能准确表达监控 条件时,需要使用多个指标联合计算来满足监控需求。 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段, 而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够 更明显易懂,以下特举本发明的
下载此资料需消耗2积分,
分享到:
收藏