事件响应 第2页
Alertmanager 高级配置:接入钉钉告警与静默管理-AI运维探索者

Alertmanager 高级配置:接入钉钉告警与静默管理

一、基于钉钉的报警媒介 [自定义机器人安全设置 - 钉钉开放平台 (dingtalk.com)](https://open.dingtalk.com/document/robots/customize-robot-security-settings) [创建自定义机器人 - 钉钉开...
头像3年前
03311
Prometheus:AlertManager配置企业微信告警-AI运维探索者

Prometheus:AlertManager配置企业微信告警

一、准备工作。 1.1 注册完成企业微信 步骤略 1.2 创建应用 点击【应用管理】-【创建应用】 填写【应用名称】、【应用介绍(选填)】并上传应用Logo后,点击【创建应用】 1.3 获取企业ID 点击【我...
头像3年前
0217
AlertManager告警分组和告警抑制:告警分组-AI运维探索者

AlertManager告警分组和告警抑制:告警分组

一、为了避免告警轰炸,将同类型的告警规则定位一组,比如将所有硬件相关的都归类到hardware,包括负载、cpu使用率、内存使用率、硬盘等。 当此类告警被触发,在一个“group_wait”时间范围内,...
头像3年前
0347
Prometheus:AlertManager配置邮件告警-AI运维探索者

Prometheus:AlertManager配置邮件告警

一、获取qq邮箱二维码。 点击【Settings】 点击【服务】 按照提示发送短信,获取授权码bcreknhkuijidifd 二、将Alertmanager的配置文件从configMap里导出来 三、编辑配置文件 删除无用配置,要...
头像3年前
0429
AlertManager告警分组和告警抑制:抑制-AI运维探索者

AlertManager告警分组和告警抑制:抑制

一、示例1: 将如下配置增加到alertmanager_config.yaml里 **说明:当集群中的某一个主机节点异常宕机导致告警NodeDown被触发,同时在告警规则中定义了告警级别severity=Critical。由于主机异常...
头像3年前
0225
Prometheus:AlertManager配置钉钉告警-AI运维探索者

Prometheus:AlertManager配置钉钉告警

一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...
头像3年前
03814
Alertmanager邮箱告警实战:接入163邮箱发送通知-AI运维探索者

Alertmanager邮箱告警实战:接入163邮箱发送通知

一、开启SMTP协议 点击【设置】-【POP3/SMTP/IMAP】 点击【开启】 点击【继续开启】 扫码后,根据提示发送短信后,点击【我已发送】 复制授权码后,点击【确定】 二、配置告警模板 进入工作目录...
头像3年前
03610
Prometheus:配置Prometheus告警规则-AI运维探索者

Prometheus:配置Prometheus告警规则

一、添加Prometheus告警规则 找到rules.yaml,将 rules.yaml: '{}' 改为以下内容 上面参数说明: * `groups` 是一个规则组的列表,每个规则组包含一组相关的告警规则。 * `name: hostStatsAlert...
头像3年前
02110
Alertmanager静默告警实战:计划内维护如何暂停通知-AI运维探索者

Alertmanager静默告警实战:计划内维护如何暂停通知

一、在计划内维护窗口,如果仍然持续接收告警通知,只会增加噪音并干扰判断。本文介绍如何通过 Alertmanager 的 Silence 功能为指定告警分组临时静默通知。 假如正在维护,我们不想一直收到告警...
头像3年前
02315
SkyWalking 告警实战:默认规则、动态配置与告警媒介-AI运维探索者

SkyWalking 告警实战:默认规则、动态配置与告警媒介

一、基于Skywalking的告警概述 官方指南:[apache/skywalking · GitHub](https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-alarm.md) **基本原理&告警媒...
头像3年前
03215