操作指南

首页应用数据概览

  1. 登录云质效平台(AOM)
  2. 默认进入首页,首页展示整个应用的运行概览,具体指标说明如下:image
    • 概览栏:
      • 展示了目前可监控对象的种类及个数,种类依次为应用、云服务器、云物理主机、IIS服务、MySQL数据库、Oracle数据库、Nginx服务器,点击不同的种类可跳转至相应资源的运行管理界面
    • CPU利用率:
      • 第一部分展示整体CPU的利用率情况,并展示服务器总数、云服务器总核数;
      • 第二部分按应用为单位,展示各应用的CPU利用率情况及其所使用的云服务器数量、云服务器总核数,每页展示三个应用。鼠标放至第二部分两侧可出现翻页按钮,点击可翻页。右上方有应用总数、当前页数及总页数,可定位当前应用所在页数
        • 内存资源利用率
      • 第一部分展示整体内存资源的利用率情况,并展示内存使用量、云服务器总内存
      • 第二部分按应用为单位,展示各应用的内存资源利用率情况及其内存使用量、云服务器总内存,每页展示三个应用。鼠标放至第二部分两侧可出现翻页按钮,点击可翻页。右上方有应用总数、当前页数及总页数,可定位当前应用所在页数
    • 应用存储资源利用率
      • 展示应用存储资源利用率,每页展示两条含全部存储(当作一个应用)在内的应用存储资源信息,应用存储资源信息包括应用存储资源利用率、云服务器硬盘已用、云服务器硬盘总量。鼠标放至两侧可出现翻页按钮,点击可翻页。右下方有当前页数及总页数,可定位当前应用所在页数

应用概览大屏

全部应用运行概览大屏

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】菜单后,点击左侧菜单栏中【应用质量运行大屏】下的【应用质量运行大屏】菜单,进入应用质量运行大屏的界面,具体指标说明如下:image
    • 数据更新时间:
      • 记录大屏最近一次更新数据的时间,大屏5分钟后自动进行数据更新并记录时间
    • 应用:
      • 应用总数:接入平台的全部应用数量
      • 应用故障数:接入平台的应用中发生故障的应用数量
      • 百分比:应用故障数/应用总数
    • 资产:
      • 云服务器总数:搭载应用的云服务器总数
      • 云服务器故障数:搭载应用的云服务器中发生故障的数量
      • 百分比:云服务器故障数/云服务器总数
    • 用户:
      • 访问总数:自系统运行以来用户访问全部应用的总次数
      • 访问失败数:自系统运行以来用户访问某应用失败的次数
      • 百分比:访问失败数/访问总数
    • 应用使用:
      • 用户访问各应用的次数统计,取前10名进行展示,并展示各应用访问的平均数
    • 资源利用:
      • CPU资源量(C):单个应用每百用户使用CPU资源(核)的排名前10,并展示各应用使用CPU资源的平均数;
      • 内存资源量(GB):单个应用每百用户使用内存资源(GB)的排名前10,并展示各应用使用内存资源的平均数;
      • 存储资源量(GB):单个应用每百用户使用存储资源(GB)的排名前10,并展示各应用使用存储资源的平均数。
    • 云服务器使用率:
      • 总数:搭载应用的云服务器总数;
      • CPU:各云服务器的cpu使用率在<20%,20%~70%,>70%三个区间的数量;
      • 内存:各云服务器的内存使用率在<20%,20%~70%,>70%三个区间的数量;
    • 应用列表概述:
      • 展示该应用的用户访问数、设备梳理、告警总数、未处理告警数等数据;
    • 告警列表区:
      • 告警列表展示全部接入应用产生的告警中未得到处理的告警详情,并对其中未处理的严重告警特别计数。

轮播应用运行概览大屏

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】菜单后,点击左侧菜单栏中【应用质量运行大屏】下的【应用质量运行大屏】菜单,进入全部应用质量运行大屏的界面;
  3. 在大屏界面中,点击左上方的“轮播”按钮,进入应用轮播的数据大屏,数据指标如下:image
    • 运行时间:
      • 当前展示应用自上次故障修复后至今正常运行的时长
    • 应用资产:
      • 云服务器总数:搭载该应用的云服务器总数;
      • 云服务器故障数:搭载该应用的云服务器发生故障的数量;
      • 百分比:云服务器故障数/云服务器总数;
    • 应用使用:
      • 访问成功:自平台运行以来用户访问该应用成功的次数
      • 访问失败:自平台运行以来用户访问该应用失败的次数;
      • 访问失败率:访问失败/(访问成功+访问失败);
    • 资源利用:
      • CPU:当前应用每百用户使用CPU资源核数;
      • 内存:当前应用每百用户使用内存资源数量;
      • 存储:当前应用每百用户使用存储资源数量;
    • 云服务器使用率:
      • 总数:搭载该应用的云服务器总数;
      • CPU:该应用各云服务器的cpu使用率在<20%,20%~70%,>70%三个区间的数量;
      • 内存:该应用各云服务器的内存使用率在<20%,20%~70%,>70%三个区间的数量。
    • 告警列表:
      • 当前应用产生的告警中未得到处理的告警详情,并对其中未处理的严重告警特别计数。

应用拓扑信息大屏

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用质量运行大屏】下的【应用质量运行大屏】菜单,进入应用质量运行大屏的界面;
  3. 在该界面中的应用模块,点击详情,进入该应用的拓扑信息大屏,数据指标如下:image
    • 数据更新时间:
      • 数据最新一次更新的时间,以5分钟为粒度;
    • 应用内部拓扑:
      • 设备图标:表示设备类型,以设备ip作为名称进行区分
      • 图标颜色:表示设备状态,正常(#1c8acd),严重告警(#e60012),主要告警(#ff6600),次要告警(#ffdd00),一般告警(#f9eaa2),警告告警(#ffffff);
      • 连线颜色:表示设备连接状态,正常(#36c8ff),警示(#fff100),异常(#e60012)
    • 应用仿真拨测展示:
      • 应用仿真拨测的几个重要时间段:DNS解析时长、TCP建立连接时长、服务器处理时长、内容传输时长的当前拨测时长、平均拨测时长、最大时长、最小时长。
    • 应用互访性能:
      • 该模块展示设备之间的连接关系,连接关系均从行指向列,图标表示连接关系的状态;抖表示连接中的抖动;延表示连接中的延迟;丢表示连接中的丢包率;

服务报告

应用拨测质量分析报表

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用质量业务分析】下的【应用拨测质量】菜单,进入应用拨测质量的界面。image
  3. 在该报告中,对应用的服务器处理内网时长、服务器处理外网时长、内网DNS解析时长、外网DNS解析时长等各类拨测的数据进行了处理。

质效报告

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【服务报告】后,点击左侧菜单栏中【质效报告】下的【云质效月报告】菜单,可查看该平台的质效报告:image
  3. 在该报告中,用户可以查看应用、服务产品的质量和效益说明,为相关决策提供依据。

资产管理

应用资产管理

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用效益评估】后,点击左侧菜单栏中【应用资产管理】下的【应用管理】菜单,进入应用管理的界面:image
  3. 应用查询,在界面中,输入应用名称进行模糊查询;
  4. 应用增加,击增加按钮打开新增应用界面,选择云中心、一级单位、二级单位,输入相关应用信息,点击下一步即可增加应用;
  5. 应用修改,选择一条应用信息,点击修改按钮,打开修改应用界面,对信息进行更新后,点击下一步即可完成应用信息的修改;
  6. 应用删除选择一条应用信息,点击删除按钮,若应用正常使用则提示“该应用已被使用,不可删除!”;若应用异常则提示“是否删除该应用”选择框,选择是则删除此应用。

中间件资产管理

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【开发商质效】后,若选择添加添加的开发商的类型,如:Nginx中间件,则点击左侧菜单栏中【中间件资产管理】下的【Nginx资产管理】菜单,进入Nginx资产管理的界面:image
  3. Nginx查询,可在编码、名称、管理IP、网络类型、状态中选择一个或多个条件进行条件组合查询,查询为模糊查询,其中编码、名称、管理IP需要手动输入,网络类型、状态需要进行选择;
  4. Nginx增加,点击增加按钮打开新增资源界面,输入资源相关信息,其中必填项必须填写,点击下一步即可增加Nginx资产;
  5. Nginx修改,选择一条Nginx资产信息,点击修改按钮,打开资源信息维护界面,对信息进行更新后,点击下一步即可完成Nginx资产信息的修改;
  6. Nginx删除,选择一条Nginx资产信息,点击删除按钮,弹出确认删除界面,点击确定,即可删除Nginx资产信息。

应用运行质量预览

应用运行监控指标汇总

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用运行情况】下的【应用运行监控】菜单,进入应用运行监控界面,主要指标说明如下:image
    • 数据概览:
      • 应用运行概览页面上方显示监控的实例总数、故障总数、新增总数,使用户对实例情况进行把控。
    • 性能数据说明:
      • 页面响应时间TOP10:所有应用中页面响应最快的前10个应用名称;
      • 下载速度TOP10:所有应用中下载速度最快的前10个应用名称;
    • 告警数据说明:
      • 所有应用产生的告警信息按照故障类型及故障等级的划分把数目展示出来,当存在非零数字时,可点击跳转到告警列表,查看详细告警信息。

应用运行监控指标详情查看

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用运行情况】下的【应用运行监控】菜单,进入应用运行监控界面。
  3. 在左侧应用列表中,点击“详情”,进入应用运行监控指标的详情的界面,主要指标说明如下:image
    • 运行概况:对应用当前的状态、运行地址、告警数、运行天数等数据进行说明
    • 性能:对应用的下载速度、页面响应时间、下载大小进行数据说明

应用可用性监控

故障监控管理

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用可用性监控】下的【故障监控管理】菜单,进入故障监控的界面:image
  3. 故障查询,可选择应用、设备类型、级别,输入设备、标题,选择时间段进行模糊查询,数据展示表单右上角会展示查询到的严重、主要、次要告警信息的分类总数。
  4. 故障清除,选择一条或多条告警,点击清除按钮,弹出告警清楚原因弹出框,用户选择告警清楚原因并进行备注后,点击确定,即可清除本条告警,被处理告警信息出现在告警流水管理页面。
  5. 故障确认及取消确认,告警产生后,运维人员与现场沟通,确认告警发生原因后,点击确认,输入告警发生原因。当告警发生原因填写错误后,点击取消确认即可取消可部分标注

故障流水管理

  1. 登录云质效平台(AOM);
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用可用性监控】下的【故障流水管理】菜单,进入故障流水管理的界面:image
  3. 故障流水查询,可选择应用、设备类型、级别,输入设备、标题,选择时间段进行模糊查询,数据展示表单右上角会展示查询到的严重、主要、次要告警信息的分类总数。
  4. 故障详情,选择一条告警信息, 点击详情按钮,可查看该告警信息的详细信息及该告警的生命周期

告警通知管理

  1. 登录云质效平台(AOM):
  2. 点击平台顶部菜单栏中的【应用运行质量】后,点击左侧菜单栏中【应用可用性监控】下的【告警通知管理】菜单,进入告警通知管理的界面:image
  3. 告警增加,点击增加按钮,可新增一条告警规则,满足该规则会按照相关的前传规则发送短信或邮件;
  4. 告警删除,删除已存在的告警规则,将该规则彻底清理掉;
  5. 告警启用/不启用,对告警规则进行配置,启用时告警规则生效,不启用时告警规则不生效;