监控告警 第5页
Prometheus:AlertManager配置钉钉告警-AI运维探索者

Prometheus:AlertManager配置钉钉告警

一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...
头像3年前
03814
Alertmanager路由规则详解:分组、匹配与发送策略-AI运维探索者

Alertmanager路由规则详解:分组、匹配与发送策略

一、Route 是 Alertmanager 中最关键的配置之一,它决定一条告警会如何分组、匹配到哪个子路由,以及最终发送给谁。本文围绕 group_by、match、match_re、matchers 和 continue 等字段讲清路由...
头像3年前
03815
Prometheus 告警规则实战:企业常用 Rules 汇总-AI运维探索者

Prometheus 告警规则实战:企业常用 Rules 汇总

一、前言 Prometheus中的告警规则允许你基于PromQL表达式定义告警触发条件,Prometheus 后端对这些触发规则进行周期性计算,当满足触发条件后则会触发告警通知。 在企业中,为了确保业务的稳定...
头像3年前
0387
Prometheus 服务发现:基于 Consul 的自动发现-AI运维探索者

Prometheus 服务发现:基于 Consul 的自动发现

一、背景 [Consul Documentation | Consul | HashiCorp Developer](https://developer.hashicorp.com/consul/docs) Prometheus配置文件 prometheus-config.yaml 配置了大量的采集规则,基本上都...
头像3年前
0378
读懂ServiceMonitor YAML:关键字段与配置示例-AI运维探索者

读懂ServiceMonitor YAML:关键字段与配置示例

一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
头像3年前
03712
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
头像3年前
03611
PromQL入门:基础语法与时间范围查询-AI运维探索者

PromQL入门:基础语法与时间范围查询

一、PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。 Prometheus ...
头像3年前
03614
Zabbix 自动接入与分布式监控实践-AI运维探索者

Zabbix 自动接入与分布式监控实践

一、自动添加主机 自动添加主机并关联模板 | 自动添加主机方案 | 含义 | 应用场景 | |----------------------|---------------------------------------------------------------------|-------...
头像3年前
03615
Alertmanager邮箱告警实战:接入163邮箱发送通知-AI运维探索者

Alertmanager邮箱告警实战:接入163邮箱发送通知

一、开启SMTP协议 点击【设置】-【POP3/SMTP/IMAP】 点击【开启】 点击【继续开启】 扫码后,根据提示发送短信后,点击【我已发送】 复制授权码后,点击【确定】 二、配置告警模板 进入工作目录...
头像3年前
03610
Kubernetes全链路监控:Skywalking配置和使用-AI运维探索者

Kubernetes全链路监控:Skywalking配置和使用

一、部署一个java应用(在192.168.1.60主机操作)。 1.1 使用其中一个k8s节点master01,安装docker 1.2 安装git 1.3 克隆zrlog源码 1.4 编译 1.5 安装zrlog应用 查看容器 二、配置java应用 2.1 使...
头像3年前
0366