Prometheus-AI运维探索者-第8页

更新

浏览

Prometheus 节点监控：部署 node-exporter 并抓取主机指标

一、node-exporter Node Exporter 是 Prometheus 官方提供的一个节点资源采集组件，可以用于收集服务器节点的数据，如 CPU频率信息、磁盘IO统计、剩余可用内存等等。 **部署创建：** 由于是针对...

Prometheus

3年前

0466

Prometheus 集群监控：接入 etcd

一、**etcd** >由上可知，启动参数里面有一个 --listen-metrics-urls=http://127.0.0.1:2381 的配置，该参数就是来指定 Metrics 接口运行在 2381 端口下面的，而且是 http 的协议，所以也不...

Prometheus

3年前

0536

Prometheus 容器监控：接入 cAdvisor

一、cAdvisor **cAdvisor 主要功能：** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行，用于收集、聚合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...

Prometheus

3年前

0336

Prometheus：使用PromQL查询监控指标

一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言，其提供对时间序列数据丰富的查询，聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...

Prometheus

3年前

0536

Prometheus：更新consul配置到Prometheus

一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加，如下。 **说明：因为consul-ui服务地址如果重启会发生变化，所以这里选择服务名** 二、重新导入配置三、重启Prometheus服务四...

Prometheus

3年前

0425

Alertmanager入门：核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后，Alertmanager 管理这些警报，包括沉默、抑制、聚合以及通过电子邮件、待命...

Prometheus

3年前

0265

AlertManager告警分组和告警抑制：抑制

一、示例1：将如下配置增加到alertmanager_config.yaml里 **说明：当集群中的某一个主机节点异常宕机导致告警NodeDown被触发，同时在告警规则中定义了告警级别severity=Critical。由于主机异常...

Prometheus

3年前

0265

Prometheus Operator 自定义监控：Helm 版 Ingress-Nginx

一、自定义资源 Prometheus-operator 通过定期循环watch apiserver，获取到CRD资源（比如 servicemonitor）的创建或者更新，将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...

Prometheus

3年前

0385

ServiceMonitor发现不到监控目标时怎么排查

一、检查kube-controller-manager的Service Monitor是否成功创建，观察到已成功创建二、检查kube-controller-manager的Service Monitor标签是否配置正确，观察到已配置使用kube-controller-ma...

Prometheus

3年前

0365

Prometheus监控Etcd实战：证书、Service与ServiceMonitor

一、Prometheus监控云原生应用流程上面流程图说明：针对云原生应用一般本身都存在一个/metrics接口，我们需要配置一个Service指向云原生应用（集群外部的应用需要应用Service指定具体IP）。同...

Prometheus

3年前

0545

上一页 1…6 78