排序
Prometheus:AlertManager配置钉钉告警
一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...
Alertmanager路由规则详解:分组、匹配与发送策略
一、Route 是 Alertmanager 中最关键的配置之一,它决定一条告警会如何分组、匹配到哪个子路由,以及最终发送给谁。本文围绕 group_by、match、match_re、matchers 和 continue 等字段讲清路由...
Prometheus 告警规则实战:企业常用 Rules 汇总
一、前言 Prometheus中的告警规则允许你基于PromQL表达式定义告警触发条件,Prometheus 后端对这些触发规则进行周期性计算,当满足触发条件后则会触发告警通知。 在企业中,为了确保业务的稳定...
Prometheus 服务发现:基于 Consul 的自动发现
一、背景 [Consul Documentation | Consul | HashiCorp Developer](https://developer.hashicorp.com/consul/docs) Prometheus配置文件 prometheus-config.yaml 配置了大量的采集规则,基本上都...
读懂ServiceMonitor YAML:关键字段与配置示例
一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
EFK技术栈收集Kubernetes日志实践
一、环境介绍 服务器可用资源 2 核 4G 以上 二、部署步骤 1.下载需要的部署文件 2.创建 EFK 所用的命名空间 3.创建 Elasticsearch 集群 4.创建 Kibana 5.在需要采集的主机上添加一个 NodeSelect...
Promtail 进阶:高级特性、配置项与场景案例
一、如何评价一款 “好” 的日志收集解决方案? 首先,优秀的日志收集解决方案应该能够 **适配** 各种 **复杂** 的场景。 其次,功能的 **全面性** 也是一个重要的考虑因素。如:具备日志过滤、...
Prometheus 黑盒监控:DNS 探测配置实战
一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
PromQL入门:基础语法与时间范围查询
一、PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。 Prometheus ...
Zabbix 自动接入与分布式监控实践
一、自动添加主机 自动添加主机并关联模板 | 自动添加主机方案 | 含义 | 应用场景 | |----------------------|---------------------------------------------------------------------|-------...










