指标监控 第7页
Prometheus 告警规则实战:企业常用 Rules 汇总-AI运维探索者

Prometheus 告警规则实战:企业常用 Rules 汇总

一、前言 Prometheus中的告警规则允许你基于PromQL表达式定义告警触发条件,Prometheus 后端对这些触发规则进行周期性计算,当满足触发条件后则会触发告警通知。 在企业中,为了确保业务的稳定...
头像3年前
0387
Prometheus 容器监控:接入 cAdvisor-AI运维探索者

Prometheus 容器监控:接入 cAdvisor

一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
头像3年前
0296
Prometheus:使用PromQL查询监控指标-AI运维探索者

Prometheus:使用PromQL查询监控指标

一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言,其提供对时间序列数据丰富的查询,聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...
头像3年前
0466
Alertmanager 高级配置:接入企业微信告警-AI运维探索者

Alertmanager 高级配置:接入企业微信告警

一、基于企业微信的报警媒介 - **实时告警通知**:企业微信/钉钉等即时通信工具能够实现实时的告警通知,使得团队 成员能够及时响应和解决问题。 - **通知范围更广**:基于企业微信/钉钉的告警...
头像3年前
0486
Prometheus 黑盒监控入门:部署 Blackbox Exporter-AI运维探索者

Prometheus 黑盒监控入门:部署 Blackbox Exporter

一、Blackbox Exporter 部署 `Exporter Configmap` 定义,可以参考下面两个链接 https://github.com/prometheus/blackbox_exporter/blob/master/CONFIGURATION.md https://github.com/prometheu...
头像3年前
0276
Prometheus 监控平台入门:架构、时序数据与适用场景-AI运维探索者

Prometheus 监控平台入门:架构、时序数据与适用场景

一、打造基于Prometheus的全方位监控平台 1.1 前言 **官网地址:**https://prometheus.io/docs/prometheus/latest/getting_started/ - 灵活的时间序列数据库; - 定制各式各样的监控规则; - Pr...
头像3年前
0426
Prometheus 节点监控:部署 node-exporter 并抓取主机指标-AI运维探索者

Prometheus 节点监控:部署 node-exporter 并抓取主机指标

一、node-exporter Node Exporter 是 Prometheus 官方提供的一个节点资源采集组件,可以用于收集服务器节点的数据,如 CPU频率信息、磁盘IO统计、剩余可用内存等等。 **部署创建:** 由于是针对...
头像3年前
0436
Prometheus 集群监控:接入 etcd-AI运维探索者

Prometheus 集群监控:接入 etcd

一、**etcd** >由上可知,启动参数里面有一个 --listen-metrics-urls=http://127.0.0.1:2381 的配置,该参数就是来指定 Metrics 接口运行在 2381 端口下面的,而且是 http 的协议,所以也不...
头像3年前
0516
Prometheus:更新consul配置到Prometheus-AI运维探索者

Prometheus:更新consul配置到Prometheus

一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加,如下。 **说明:因为consul-ui服务地址如果重启会发生变化,所以这里选择服务名** 二、重新导入配置 三、重启Prometheus服务 四...
头像3年前
0385
Alertmanager入门:核心概念与主要功能-AI运维探索者

Alertmanager入门:核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后,Alertmanager 管理这些警报,包括沉默、抑制、聚合以及通过电子邮件、待命...
头像3年前
0225