指标监控 第5页
Prometheus 集群监控:接入 etcd-AI运维探索者

Prometheus 集群监控:接入 etcd

一、**etcd** >由上可知,启动参数里面有一个 --listen-metrics-urls=http://127.0.0.1:2381 的配置,该参数就是来指定 Metrics 接口运行在 2381 端口下面的,而且是 http 的协议,所以也不...
头像3年前
0516
Prometheus:使用Grafana实现监控指标可视化-AI运维探索者

Prometheus:使用Grafana实现监控指标可视化

一、安装grafana-10.1.4版本 前期准备工作:安装helm和SC 1、下载包 2、修改values.yaml (1)定义storageClass: 'nfs-client' (2)执行`/image:`搜索镜像,替换国外镜像为国内镜像 替换docker.io/...
头像3年前
04013
Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers-AI运维探索者

Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers

一、想把 Alertmanager 用好,首先要读懂它的配置文件结构。本文结合示例配置,拆解 Global、Templates、Route、Inhibit Rules 和 Receivers 等核心块的职责与常见字段。 在介绍Alertmanager配...
头像3年前
03315
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
头像3年前
04313
黑盒监控和白盒监控有什么区别-AI运维探索者

黑盒监控和白盒监控有什么区别

一、什么是黑盒监控 黑盒监控是从外部视角对系统进行监控,类似于使用用户的角度观察系统。监控系统并不了解系统的内部工作方式,只关注对外部暴露的接口和功能的响应情况。黑盒监控主要通过发...
头像3年前
02612
Prometheus 容器监控:接入 cAdvisor-AI运维探索者

Prometheus 容器监控:接入 cAdvisor

一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
头像3年前
0296
Prometheus监控Kubernetes集群-AI运维探索者

Prometheus监控Kubernetes集群

一、监控集群节点 先把Configmap导出为yaml文件: 编辑yaml,在scrape_configs: 下面增加如下内容 应用配置 重启Prometheus服务 打开浏览器输入http://192.168.1.31:31093访问Prometheus,到Prom...
头像3年前
04410
Prometheus 集群监控:接入 kube-apiserver 与 controller-manager-AI运维探索者

Prometheus 集群监控:接入 kube-apiserver 与 controller-manager

一、新增 Kubernetes 集群架构监控 在 `prometheus-config.yaml` 一次添加如下采集数据: 1.1 **kube-apiserver** 需要注意的是使用https访问时,需要tls相关配置,可以指定ca证书路径或者 `ins...
头像3年前
0477
Prometheus:使用PromQL查询监控指标-AI运维探索者

Prometheus:使用PromQL查询监控指标

一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言,其提供对时间序列数据丰富的查询,聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...
头像3年前
0466
Alertmanager静默告警实战:计划内维护如何暂停通知-AI运维探索者

Alertmanager静默告警实战:计划内维护如何暂停通知

一、在计划内维护窗口,如果仍然持续接收告警通知,只会增加噪音并干扰判断。本文介绍如何通过 Alertmanager 的 Silence 功能为指定告警分组临时静默通知。 假如正在维护,我们不想一直收到告警...
头像3年前
02315