指标监控-AI运维探索者-第8页

AlertManager告警分组和告警抑制：抑制

一、示例1：将如下配置增加到alertmanager_config.yaml里 **说明：当集群中的某一个主机节点异常宕机导致告警NodeDown被触发，同时在告警规则中定义了告警级别severity=Critical。由于主机异常...

3年前

0265

一、自定义资源 Prometheus-operator 通过定期循环watch apiserver，获取到CRD资源（比如 servicemonitor）的创建或者更新，将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...

3年前

0385

一、检查kube-controller-manager的Service Monitor是否成功创建，观察到已成功创建二、检查kube-controller-manager的Service Monitor标签是否配置正确，观察到已配置使用kube-controller-ma...

3年前

0365

一、Prometheus监控云原生应用流程上面流程图说明：针对云原生应用一般本身都存在一个/metrics接口，我们需要配置一个Service指向云原生应用（集群外部的应用需要应用Service指定具体IP）。同...

3年前

0545