Prometheus 第5页
Alertmanager静默告警实战:计划内维护如何暂停通知-AI运维探索者

Alertmanager静默告警实战:计划内维护如何暂停通知

一、在计划内维护窗口,如果仍然持续接收告警通知,只会增加噪音并干扰判断。本文介绍如何通过 Alertmanager 的 Silence 功能为指定告警分组临时静默通知。 假如正在维护,我们不想一直收到告警...
头像3年前
02315
PrometheusAlert 入门:为什么需要告警消息转发平台-AI运维探索者

PrometheusAlert 入门:为什么需要告警消息转发平台

一、为什么要用PrometheusAlert? - 1.1 背景 - 通过configmap配置文件维护告警媒介辨析度低; - 部分快消息告警媒介需要额外部署webhook做转发; - alertmanager web UI 较简单,不足以展示更...
头像3年前
02512
Prometheus 对接 Alertmanager:告警配置与测试-AI运维探索者

Prometheus 对接 Alertmanager:告警配置与测试

一、Prometheus添加告警配置 修改ConfigMap资源文件prometheus-config.yaml,改动内容如下: - 添加AlertManager服务器地址 - 指定告警规则文件路径位置 - 添加Prometheus中触发告警的告警规则(...
头像3年前
0349
Prometheus监控MySQL实战:Exporter与ServiceMonitor配置-AI运维探索者

Prometheus监控MySQL实战:Exporter与ServiceMonitor配置

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
头像3年前
0288
Alertmanager 入门与部署:告警分组、抑制和邮件通知-AI运维探索者

Alertmanager 入门与部署:告警分组、抑制和邮件通知

一、Alertmanager简介 - 1.1 AlertManager常用的功能 - **抑制**:指的是当某一告警信息发送后,可以停止由此告警引发的其它告警,避免相 同的告警信息重复发送。 - **静默**:静默也是一种机制...
头像3年前
02415
Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS-AI运维探索者

Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS

一、scheduler >由上可知,匹配pod对象,lable标签为component=kube-scheduler即可scheduler和controller-manager一样,默认监听0端口,需要注释 所有Master节点修改 `/etc/kubernetes/manif...
头像3年前
0539
Prometheus:利用consul监控Nginx-AI运维探索者

Prometheus:利用consul监控Nginx

一、新起一个nginx pod。 查看 二、到pod里面安装vim,去配置一下status页 三、在Pod里面编辑配置文件 在最后面的 } 上面添加如下内容(可以使用shift+insert进行粘贴) 在Pod里面重新加载 四、在P...
头像3年前
04310
Blackbox Exporter监控域名实战-AI运维探索者

Blackbox Exporter监控域名实战

一、创建一个空文件,然后通过该文件创建一个 Secret,那么这个 Secret 即可作为 Prometheus 的静态配置 查看 Secret是否创建完成 二、创建完 Secret 后,需要编辑下 Prometheus 配置 三、参考[...
头像3年前
0317
PrometheusAlert 对接 Alertmanager:路由与测试验证-AI运维探索者

PrometheusAlert 对接 Alertmanager:路由与测试验证

一、配置Alertmanager接入PrometheusAlert 更新alertmanager配置,将所有的告警均指向告警分发平台 接口说明: 热加载alertmanager服务: 二、测试验证 验证所有的告警是否发送到指定的群组: ...
头像3年前
0248
Prometheus 服务发现:基于 Consul 的自动发现-AI运维探索者

Prometheus 服务发现:基于 Consul 的自动发现

一、背景 [Consul Documentation | Consul | HashiCorp Developer](https://developer.hashicorp.com/consul/docs) Prometheus配置文件 prometheus-config.yaml 配置了大量的采集规则,基本上都...
头像3年前
0378