监控告警 第9页
Alertmanager 高级配置:接入企业微信告警-AI运维探索者

Alertmanager 高级配置:接入企业微信告警

一、基于企业微信的报警媒介 - **实时告警通知**:企业微信/钉钉等即时通信工具能够实现实时的告警通知,使得团队 成员能够及时响应和解决问题。 - **通知范围更广**:基于企业微信/钉钉的告警...
头像3年前
0526
Prometheus 黑盒监控入门:部署 Blackbox Exporter-AI运维探索者

Prometheus 黑盒监控入门:部署 Blackbox Exporter

一、Blackbox Exporter 部署 `Exporter Configmap` 定义,可以参考下面两个链接 https://github.com/prometheus/blackbox_exporter/blob/master/CONFIGURATION.md https://github.com/prometheu...
头像3年前
0316
Prometheus 监控平台入门:架构、时序数据与适用场景-AI运维探索者

Prometheus 监控平台入门:架构、时序数据与适用场景

一、打造基于Prometheus的全方位监控平台 1.1 前言 **官网地址:**https://prometheus.io/docs/prometheus/latest/getting_started/ - 灵活的时间序列数据库; - 定制各式各样的监控规则; - Pr...
头像3年前
0446
Zabbix Agent 与多场景监控实践-AI运维探索者

Zabbix Agent 与多场景监控实践

一、zabbix客户端概述 zabbix客户端 应用场景 <tbod
头像3年前
0546
ServiceMonitor发现不到监控目标时怎么排查-AI运维探索者

ServiceMonitor发现不到监控目标时怎么排查

一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...
头像3年前
0365
Prometheus监控Etcd实战:证书、Service与ServiceMonitor-AI运维探索者

Prometheus监控Etcd实战:证书、Service与ServiceMonitor

一、Prometheus监控云原生应用流程 上面流程图说明: 针对云原生应用一般本身都存在一个/metrics接口,我们需要配置一个Service指向云原生应用(集群外部的应用需要应用Service指定具体IP)。同...
头像3年前
0545
Prometheus:更新consul配置到Prometheus-AI运维探索者

Prometheus:更新consul配置到Prometheus

一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加,如下。 **说明:因为consul-ui服务地址如果重启会发生变化,所以这里选择服务名** 二、重新导入配置 三、重启Prometheus服务 四...
头像3年前
0425
Alertmanager入门:核心概念与主要功能-AI运维探索者

Alertmanager入门:核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后,Alertmanager 管理这些警报,包括沉默、抑制、聚合以及通过电子邮件、待命...
头像3年前
0265
AlertManager告警分组和告警抑制:抑制-AI运维探索者

AlertManager告警分组和告警抑制:抑制

一、示例1: 将如下配置增加到alertmanager_config.yaml里 **说明:当集群中的某一个主机节点异常宕机导致告警NodeDown被触发,同时在告警规则中定义了告警级别severity=Critical。由于主机异常...
头像3年前
0265
Prometheus Operator 自定义监控:Helm 版 Ingress-Nginx-AI运维探索者

Prometheus Operator 自定义监控:Helm 版 Ingress-Nginx

一、自定义资源 Prometheus-operator 通过定期循环watch apiserver,获取到CRD资源(比如 servicemonitor)的创建或者更新,将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...
头像3年前
0385