排序
AlertManager告警分组和告警抑制:抑制
一、示例1: 将如下配置增加到alertmanager_config.yaml里 **说明:当集群中的某一个主机节点异常宕机导致告警NodeDown被触发,同时在告警规则中定义了告警级别severity=Critical。由于主机异常...
Prometheus Operator 自定义监控:Helm 版 Ingress-Nginx
一、自定义资源 Prometheus-operator 通过定期循环watch apiserver,获取到CRD资源(比如 servicemonitor)的创建或者更新,将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...
ServiceMonitor发现不到监控目标时怎么排查
一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...
Prometheus监控Etcd实战:证书、Service与ServiceMonitor
一、Prometheus监控云原生应用流程 上面流程图说明: 针对云原生应用一般本身都存在一个/metrics接口,我们需要配置一个Service指向云原生应用(集群外部的应用需要应用Service指定具体IP)。同...





