告警

告警历史

告警历史展示30天内所有的告警信息,方便您管理、回溯和查看告警记录,让您对业务的运行状态了然于心。

使用限制:

• 历史告警最多保存30天

操作步骤

  1. 登录云监控控制台。

  2. 在控制台顶部导航栏选择区域。

  3. 点击左侧菜单栏中【告警】>【告警历史】,进入【告警历史】页面。

  4. 点击“监控对象”名称,跳转至【云服务】>【服务资源,例如:云服务器】>【监控指标】页面。

  5. 点击“告警规则”名称,跳转至【告警】>【告警规则】>【告警规则详情】页面。

  6. 可选择自定义时间,查看告警历史。

  7. 输入“监控对象”名称,点击“搜索”按钮,模糊查询告警历史信息。 备份策略

  8. 点击“告警触发数据”按钮,弹出弹框,可查看具体是什么数据在什么时间触发了告警规则。注:正常状况下,由于告警需要计算触发,告警产生时间可能略晚于最新的数据触发时间几秒。 告警触发数据

  9. 点击“告警流水”按钮,弹出折线图,可查看近一段时间内的监控对象的指标数据变化情况。 告警流水

  10. 告警状态:

    已恢复:已经恢复正常状态

    未恢复:没有被处理或正在被处理的告警

    数据不足:

    • 产生告警的告警策略已被删除。

    • 云服务器从一个项目迁移至另一个项目。

    • 未安装或者卸载云监控插件,无数据上报。

    告警由“正常”到“异常”需要告警一次,【告警历史】页面中会新增一个列表项。

    举例:每5分钟收集一次CPU使用率的数据,若某个ECS的CPU利用率大于80%则触发告警,每3小时告警一次。在“异常”状态停留3小时,除了第1次告警提示后,后续时间内的告警就不会发送给您,但在告警触发数据里面会看到这3小时内的所有数据。直到由“异常”到“正常”,【告警历史】页面中的列表项只是做状态和持续时间做更改,不新增列表项。

    举例:8点告警一次,8点10分恢复正常,8点20分有告警一次,这是告警历史列表中有两条信息。

告警规则

监控为您提供了监控数据的告警功能,您可灵活配置云服务资源的告警规则,一旦云服务资源发生异常触发告警规则阈值时,系统会第一时间通过短信、邮件等方式发送告警通知,以便您能及时排查资源及业务异常,迅速定位并处理故障。

使用限制:
•    单个告警规则可选择的监控对象数最多50个
•    单个告警规则可选择的告警策略最多20个

查看告警规则

操作步骤

  1. 登录云监控控制台。

  2. 在控制台顶部导航栏选择区域。

  3. 点击左侧菜单栏中【告警】>【告警规则】,进入【告警规则】页面。

告警规则

新建告警规则

操作步骤

  1. 点击“新建告警规则”按钮,进入【新建告警规则】页面。

  2. 填写规则信息

    • 告警规则名称:1-50个字符,只能包含中英文、数字、下划线、中划线。

    • 描述:1-100个字符,只能包含中英文、数字、下划线、中划线,非必填项。

    新建告警规则1

  3. 填写告警规则

    • 服务类型:选择需要监控的云服务资源,例如:云服务器

    • 资源范围:需要监控的云服务资源对应的数据指标所属的范围,例如:实例

    • 监控对象类型:指定资源/资源分组,选择资源分组时将会已分组为维度产生告警。

    • 监控对象:勾选监控对象

    • 策略类型:可将创建的对应服务类型的告警模板导入直接使用,也可以自定义告警策略。

    • 告警策略:数据指标在1分钟/5分钟/15分钟/30分钟/60分钟周期内,采集周期运算:平均值、最大值、最小值、求和值,大于/大于等于/小于/小于等于/等于某个值,告警每5分钟/10分钟/15分钟/30分钟/1小时/2小时/3小时/不重复告警一次 。随着数据指标变化,后面的单位也随之变换。1分钟采集周期取原始值,后面聚合运算框置灰,5分钟/15分钟/30分钟/60分钟采集周期统计可取平均值、最大值、最小值、求和值。

    • 告警级别:根据告警的严重程度分为不同等级,可选择紧急、重要、次要、提示。 新建告警规则2

  4. 配置告警通知:选择主题,如果没有主题,请点击“创建主题”,新打开一个页面消息通知MNS服务,在MNS上可以设置告警联系人(可多个联系人一同设置)+通知方式:短信、邮件等。

  5. 点击“提交”按钮,创建告警规则完毕。

启用告警规则

操作步骤

  1. 您可以选择以下两个路径启用告警规则。

  2. 在【告警规则】页面,点击单个告警规则所在行“启用”按钮,在弹出的“启用告警规则”弹框,点击“确认”按钮,启用该告警规则。

  3. 在【告警规则】页面,选择单个告警规则名称,进入【告警规则详情】页面, 点击右上角“启用”按钮,弹出弹框,点击“确认”按钮,启用该告警规则。

  4. 启用告警规则后,当监控数据指标触发设定的阈值时,云监控会在第一时间以短信、邮件等方式通知您云上资源异常,以免因此造成业务损失。

    启用告警规则

停用告警规则

操作步骤

  1. 您可以选择以下两个路径停用告警规则。

  2. 在【告警规则】界面,点击单个告警规则所在行“停用”按钮,在弹出的“停用告警规则”弹框,点击“确认”按钮,停用该告警规则。

  3. 在【告警规则】页面,选择单个告警规则名称,进入【告警规则详情】页面, 点击右上角“停用”按钮,弹出弹框,停用该告警规则。

  4. 停用后将不再计算指标是否达到阈值,不再触发警告。

停用告警规则

查看告警规则详情

操作步骤

  1. 点击“名称”按钮,跳转至【告警规则详情】页面。

  2. 规则信息:最近24小时内告警次数,其余信息与【新建告警规则】页面信息一致

告警规则详情

修改告警规则

操作步骤

  1. 您可以选择以下两个路径进入【修改告警规则】页面。

  2. 在【告警规则】界面,点击单个告警规则所在行“更多”按钮,选择“修改”选项。

  3. 点击【告警规则】,点击单个告警规则名称,进入【告警规则详情】页面,点击右上角“修改”按钮。

  4. 除了“服务类型”、“资源范围”不可修改,其余都可修改。

修改告警规则

删除告警规则

操作步骤

  1. 在【告警规则】页面上,选择单个告警规则所在行,点击“更多”按钮,选择“删除”选项,删除告警规则。

  2. 删除后将无法回退,请谨慎操作。

删除告警规则

查看资源详情

操作步骤

  1. 在【告警规则】页面上,选择单个告警规则所在行,点击“更多”按钮,选择“查看资源详情”选项,弹出弹框,查看该告警规则有哪些云服务资源在使用。

  2. 点击“查看监控指标”按钮,跳转至【云服务监控】>【服务资源,例如:云服务器】>【监控指标】页面。

  3. 输入云服务资源名称或者ID,搜索查询云服务资源。

    查看资源详情

告警模板

您可以通过告警模板为多个云服务资源批量创建告警规则,推荐您使用告警模板,方便管理集中云服务资源。

使用限制:
可创建自定义告警模板数50个
告警模板可添加告警规则数20个

查看告警模板

操作步骤

1.登录云监控控制台。

2.在控制台顶部导航栏选择区域。

3.点击左侧菜单栏中【告警】>【告警模板】,进入【告警模板】页面。 查看告警模板

创建告警模板

操作步骤

1.点击“新建告警模板”按钮,进入【新建告警模板】页面。

2.填写规则信息。

告警模板名称:1-50个字符,只能包含中英文、数字、“.”、“-”、“_”

描述:1-100个字符,只能包含中英文、数字、下划线、中划线,非必填项。

创建告警模板

3.配置告警内容

服务类型:选择需要监控的云服务资源,例如:云服务器

资源范围:需要监控的云服务资源对应的数据指标所属的范围,例如:实例

系统类型:Linux、Windows

告警策略:选择数据指标在1分钟/5分钟/15分钟/30分钟/60分钟周期内,采集周期运算:平均值、最大值、最小值、求和值,大于/大于等于/小于/小于等于/等于某个值,告警每5分钟/10分钟/15分钟/30分钟/1小时/2小时/3小时/不重复告警一次 。随着数据指标变化,后面的单位也随之变换。1分钟采集周期取原始值,后面聚合运算框置灰,5分钟/15分钟/30分钟/60分钟采集周期统计可取平均值、最大值、最小值、求和值。

4.点击“提交”按钮,创建告警规则完毕。

编辑告警模板

操作步骤

1.点击“编辑告警模板”按钮,进入【编辑告警模板】页面。

2.在【告警模板】界面,点击单个告警模板所在行“编辑”按钮,编辑告警模板。

3.除了“服务类型”、“资源范围”不可修改,其余都可修改。

编辑告警模板

删除告警模板

操作步骤

  1. 在【告警模板】页面上,选择单个告警模板所在行,点击“删除”按钮,删除告警模板。

  2. 删除后将无法回退,请谨慎操作。

删除告警模板