logo好方法网

一种监测部署于云平台的应用运行质量的无侵入仿真方法


技术摘要:
本发明公开了一种监测部署于云平台的应用运行质量的无侵入仿真方法,属于云计算技术领域,该方法通过在同一平台建立外部虚拟机,虚拟化同质的外部资源,模拟用户应用的运行环境,对应用可用性、云平台、计算、存储和网络的运行质量指标进行收集,实现基于租户具体应用  全部
背景技术:
基于云计算的云服务产品已成为IT的主流资源支撑方案,上云、用云也代替了传 统使用模式和运维模式,服务商主导云资源提供和服务,租户使用云资源。随着上云业务的 扩大,当前的主要矛盾已经从“服务于使用”转向“服务于体验”。客户对运行在云上的应用, 质量要求越来越高,经常会因为打开延迟、性能降低等问题投诉云服务商。
技术实现要素:
本发明的技术任务是针对以上不足之处,提供一种监测部署于云平台的应用运行 质量的无侵入仿真方法,能够实现在没有授权的前提下,不通过侵入租户使用的资源,为租 户提供更好的云资源服务,实现个性化的使用体验保障。 本发明解决其技术问题所采用的技术方案是: 一种监测部署于云平台的应用运行质量的无侵入仿真方法,通过在同一平台建立 外部虚拟机,虚拟化同质的外部资源,模拟用户应用的运行环境,对应用可用性、云平台、计 算、存储和网络的运行质量指标进行收集,实现基于租户具体应用的运行质量监测。 因云平台服务商没有客户资源的操作权限,通过建立外部仿真环境模拟租户的使 用体验。 从应用可用性、平台、计算、存储和网络5各方面构造运行在云平台上的无侵入的 租户应用运行质量仿真检测,以应用为对象,实质体现了整个云平台的运行质量,使运维方 式从整体的粗放型到应用的个性化保障,既解决了应用可用性问题,也解决了应用不可用 时的可能原因。 优选的,所述应用可用性的运行质量指标收集包括应用云外访问质量指标的采集 获取和应用云内访问质量指标的采集获取, 应用云外访问,模拟使用者通过浏览器打开应用访问的操作,用命令来仿真测试 应用的运行质量,仿真命令支持常用的IE(v8及以上版本)、Google、火狐等浏览器,仿真命 令执行的结果是应用运行质量的直接体现;指标包括NDS解析时长、TCP协议建立时长、系统 白屏时长、首页显示时长和下载速度; 采集方式以HTTP协议为基础,结合返回码确认,采集命令自动适应3XX的重定向等 情况,并判断4XX、5XX为异常返回值,当出现异常时,再使用其他环节结果辅助判断故障原 因,如云内访问、计算、存储、网络等质量; 为了减少应用监测的异常告警,特别是网络质量造成的访问延迟告警,还优化了 告警机制,本方法以监测应用为区分对象,把当前网络质量时延及该应用正常访问时长做 算法处理获得门限值APP-Time,当监测的访问时长超出APP-Time时再发出异常告警;应用 4 CN 111597099 A 说 明 书 2/10 页 首页加载时长,设置动态门限值APP-Time,通过函数F(应用正常访问时长,当前网络延迟时 长)计算获得; 应用云内访问,把仿真检测程序部署到网络节点上,在租户VLAN网关内部做仿真 测试,能够获得较真实的监测结果; 云内应用仿真拨测可以根据结构情况,跳过DNS环节,直接使用云内地址(至少是 可访问的Floating  IP地址)进行HTTP协议的探测,指标包括连接建立时长、系统白屏时长、 首页显示时长和下载速度; 应用拨测返回码异常,或者访问超时都会以告警方式通知,算法和实现参考云外 部分。 优选的,云平台质量指标的采集获取,通过在nail内部的采集进程,周期性调用网 卡元数据接口和端口元数据接口计算,并评估信息获取的完整性和时延,以评价云平台支 撑能力质量。该指标在nail(客户端)的判断策略里实现,如果异常则上传到wall(服务端) 统一管理并告警。 进一步的,以云平台的宿主机为单位建立原子性载体nail,承担计算、存储、网络 质量的仿真监测功能,监测方案中功能实现采用两级体制,执行单元为nail,管理单元为 wall;nail由虚拟化平台统一关键并管理,以便能更直观体现虚拟化平台的运行情况,如云 平台运行波动、延迟等;nail所在在宿主机故障后,不需要疏散到其他宿主机上; nail内部安装用于监测的程序,监测策略由集中管理系统wall统一管理,并建立 通道,交互相关信息; 按照心跳机制nail周期性向wall汇报自己的存活状态,wall在规定周期内收不到 nail的汇报,根据个数情况,判断是宿主机问题,还是云平台群体性问题; nail发起的连通性监测对象及监测策略,由wall判断并下发; nail发起的存储IO监测方式,如顺序读/写,随机读/写,以及数据块的大小,根据 监测需要可定制化调整并下发; nail发起的点到点之间数据包传输监测策略,由wall配置并下发。 优选的,对于计算质量指标的采集获取,从宿主机的角度判断对其上虚拟机的支 撑能力,指标包括CPU和内存的资源支撑能力、CPU因IO不及时造成的中断等待次数以及CPU 处理任务的排队长度; 通过nail执行云平台操作控制节点的数据接口,监测自该点发起的平台访问可达 性,为其他访问可达性做仿真性验证; 收集并反馈nail在宿主机的CPU、内存、本地硬盘的利用率,及vCPU、内存的分配 率,异常信息以告警形式通知。 优选的,对于存储质量指标的采集获取,通过在nail中部署对文件和数据库两类 方式的探测程序,对底层存储的运行质量进行监测,并从部署的应用上做仿真访问,判断IO 是否影响了正常运行; 文件性能指标,通过在nail部署的程序按照监测策略,反复操作一个文件体,获取 相关性能指标; 数据库性能指标,除获取数据库的QPS、TPS外,还对指定数据库表的数据用SQL语 句查询获取,记录查询这些固定数据的耗时,用来验证当前数据库可用,并且查询数据库的 5 CN 111597099 A 说 明 书 3/10 页 速度是否正常。 文件与云平台存储资源池之间的IO质量监测,包括顺序读写、随机读写的延时、抖 动及IOPS等性能指标; 数据库与云平台存储资源池之间的IO质量监测,包括QPS和TPS等性能指标。 对监测的性能指标可以设置门限值,异常数据以告警方式通知到集中管理wall; 除性能指标外,在文件和数据库与存储交互过程中产生的错误日志,也将以告警 的方式发送到集中管理系统wall。 优选的,对于网络质量指标的采集获取,通过存在的物理同路由事实仿真测试同 应用内部不同虚机的互访质量。 通过部署于nail内的agent,可以实现TCP、HTTP、ICMP等协议的网络质量探测,也 可以使用traceroute等跟踪经过的路由及质量情况。该操作可以识别同应用内受网络质量 影响的响应时延。通过仿真监测可以实现同应用内部不同虚机间的丢包、错误、时延、目标 不可达等问题。 在同宿主机上把nail配置为透明模式,把需要分析虚机的数据流量引到nail的指 定端口上,并通过指定源IP、PORT或目标IP、PORT,结合传输协议等辅助条件,获取对应的数 据包并进行分析发现网络连接不成功的具体原因,或者长时间执行的程序语句内容。 进一步的,根据CMDB自动化增加新监测对象和策略, 云服务商开通资源后,根据设置的用途信息,自动形成应用内部拓扑关系;根据拓 扑关系自动形成监测点,如web到app,app到db之间的网络时延、抖动等质量,并可根据应用 特点个性化设置门限值,对异常数据以告警形式发出;模拟应用使用的协议以发现端到端 路由上的传输质量情况,如丢包、抖动和延迟等; 根据监测点需要,抓取源到目标的数据包,判断内容及返回值,辅助定位可能存在 的问题, 通过数据包内容分析,确定应用服务器与数据库服务器连接的质量问题和可能原 因; 通过数据包内容分析,确认应用服务器与web服务器连接的质量问题和可能原因。 本方法的实质是对云平台的个性化质量监测,以租户应用为验证样本,解决了云 服务商只能提供云平台整体SLA,无法针对具体租户提供服务质量体验的问题。实现了没有 授权无法在租户应用使用服务实例内部署探针的前提下,提供个性化的使用体验监测方 案。 本发明还要求保护一种监测部署于云平台的应用运行质量的无侵入仿真装置,包 括:至少一个存储器和至少一个处理器; 所述至少一个存储器,用于存储机器可读程序; 所述至少一个处理器,用于调用所述机器可读程序,执行上述的方法。 本发明还要求保护计算机可读介质,所述计算机可读介质上存储有计算机指令, 所述计算机指令在被处理器执行时,使所述处理器执行上述的方法。 本发明的一种监测部署于云平台的应用运行质量的无侵入仿真方法与现有技术 相比,具有以下有益效果: 本方法从应用可用性、平台、计算、存储、网络五个方面构造了运行在云平台上的 6 CN 111597099 A 说 明 书 4/10 页 无侵入的租户应用运行质量仿真监测方法。以应用为对象,实质体现了整个云平台的运行 质量,使运维方式从整体的粗放型到应用的个性化保障。既解决了应用可用性问题,也解决 了应用不可用时的可能原因。 解决了云服务商和租户之间因为监测权限问题造成的信息不对称问题,即租户不 给服务商授权,但还需要服务商出具应用不可用时的具体原因和解决办法; 提供了服务商为租户提供重点保障和个性化的支撑手段,为服务商提供不同SLA 提供了数据基础和依据; 解决了租户应用使用感受被平台统计数据“平均”化的问题; 解决了某些平台型故障对租户应用影响深度的确定问题,服务商在处理故障时能 够清晰的明确是否已经根除,并消除了对租户应用的影响。 附图说明 图1是本发明一个实施例提供的该方法的功能架构图; 图2是本发明一个实施例提供的应用端到端的展示示意图; 图3是本发明一个实施例提供的虚机网络连接示意图; 图4是本发明一个实施例提供的该方法的部署架构图。
下载此资料需消耗2积分,
分享到:
收藏