指标监控 第4页
PrometheusAlert 对接 Alertmanager:路由与测试验证-AI运维探索者

PrometheusAlert 对接 Alertmanager:路由与测试验证

一、配置Alertmanager接入PrometheusAlert 更新alertmanager配置,将所有的告警均指向告警分发平台 接口说明: 热加载alertmanager服务: 二、测试验证 验证所有的告警是否发送到指定的群组: ...
头像3年前
0248
PrometheusAlert 入门:为什么需要告警消息转发平台-AI运维探索者

PrometheusAlert 入门:为什么需要告警消息转发平台

一、为什么要用PrometheusAlert? - 1.1 背景 - 通过configmap配置文件维护告警媒介辨析度低; - 部分快消息告警媒介需要额外部署webhook做转发; - alertmanager web UI 较简单,不足以展示更...
头像3年前
02512
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
头像3年前
04313
Prometheus+Alertmanager实战:MySQL连接失败告警-AI运维探索者

Prometheus+Alertmanager实战:MySQL连接失败告警

一、监控数据库 在实现告警之前,我们需要先实现监控。下面通过Exporter实现对数据库的监控: 具体如何实现对数据库的监控,可参考:[Prometheus实战---监控非云原生应用Mysql](https://zhuanla...
头像3年前
03111
Prometheus 黑盒监控:外部域名的 HTTP 与 POST 探测-AI运维探索者

Prometheus 黑盒监控:外部域名的 HTTP 与 POST 探测

一、HTTP 监控(监控外部域名) 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-external-website` 任务 二、HTTP Post 监控(监控外部域名) 按...
头像3年前
0398
Prometheus 黑盒监控:TCP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:TCP 探测配置实战

一、TCP检测 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `service-tcp-probe` 任务 则需要在service上添加注释必须有以下三行 示例:Java应用的svc:
头像3年前
03410
Prometheus 黑盒监控:K8S 内部 HTTP 探测-AI运维探索者

Prometheus 黑盒监控:K8S 内部 HTTP 探测

一、HTTP 监控(K8S 内部发现方法) 1.1 自定义发现 `Service` 监控 `端口` 和 `路径` 可以如下设置: 然后,需要在 `Service` 中配置这样的 `annotation` : 示例:Java应用的svc: 按上面方法...
头像3年前
02212
Prometheus 黑盒监控:Ingress 服务探测-AI运维探索者

Prometheus 黑盒监控:Ingress 服务探测

一、Ingress服务的探测(视频中未讲到,扩展+) 则需要在ingress上添加注释必须有以下三行 示例:Java应用的ing:
头像3年前
04910
Prometheus 黑盒监控:ICMP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:ICMP 探测配置实战

一、ICMP监控 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-http-services` 任务
头像3年前
0527
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
头像3年前
03611