排序
Prometheus 节点监控:部署 node-exporter 并抓取主机指标
一、node-exporter Node Exporter 是 Prometheus 官方提供的一个节点资源采集组件,可以用于收集服务器节点的数据,如 CPU频率信息、磁盘IO统计、剩余可用内存等等。 **部署创建:** 由于是针对...
Prometheus 集群监控:接入 etcd
一、**etcd** >由上可知,启动参数里面有一个 --listen-metrics-urls=http://127.0.0.1:2381 的配置,该参数就是来指定 Metrics 接口运行在 2381 端口下面的,而且是 http 的协议,所以也不...
Prometheus 容器监控:接入 cAdvisor
一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
Prometheus:使用PromQL查询监控指标
一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言,其提供对时间序列数据丰富的查询,聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...
Prometheus:更新consul配置到Prometheus
一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加,如下。 **说明:因为consul-ui服务地址如果重启会发生变化,所以这里选择服务名** 二、重新导入配置 三、重启Prometheus服务 四...
Alertmanager入门:核心概念与主要功能
一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后,Alertmanager 管理这些警报,包括沉默、抑制、聚合以及通过电子邮件、待命...
AlertManager告警分组和告警抑制:抑制
一、示例1: 将如下配置增加到alertmanager_config.yaml里 **说明:当集群中的某一个主机节点异常宕机导致告警NodeDown被触发,同时在告警规则中定义了告警级别severity=Critical。由于主机异常...
Prometheus Operator 自定义监控:Helm 版 Ingress-Nginx
一、自定义资源 Prometheus-operator 通过定期循环watch apiserver,获取到CRD资源(比如 servicemonitor)的创建或者更新,将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...
ServiceMonitor发现不到监控目标时怎么排查
一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...
Prometheus监控Etcd实战:证书、Service与ServiceMonitor
一、Prometheus监控云原生应用流程 上面流程图说明: 针对云原生应用一般本身都存在一个/metrics接口,我们需要配置一个Service指向云原生应用(集群外部的应用需要应用Service指定具体IP)。同...











