排序
ServiceMonitor入门:定义、价值与工作机制
一、ServiceMonitor是什么 ServiceMonitor 是 Prometheus Operator 提供的一种 Kubernetes 自定义资源(Custom Resource),用于告诉 Prometheus 如何监控服务(Service)。它是 Prometheus Ope...
Prometheus Operator 自定义监控:常规部署 Ingress-Nginx
一、抓取自定义资源 -- 常规部署的Ingress-nginx 1.1 修改Ingress Service 1.2 修改Ingress deployment 1.3 测试验证 1.4 新增Ingress ServiceMonitor 1.5 添加报警规则 二、导入Grafana模板 `I...
Prometheus架构与指标采集机制解析
一、Prometheus架构 Prometheus 生态系统由多个组件组成,其中架构图如下: 关于每个组件的用途如下: * **Prometheus Server(Prometheus 服务器):**Prometheus Server 是核心组件,负责数据...
Zabbix 自动接入与分布式监控实践
一、自动添加主机 自动添加主机并关联模板 | 自动添加主机方案 | 含义 | 应用场景 | |----------------------|---------------------------------------------------------------------|-------...
大模型运维监控入门:命令行工具、Prometheus 与 Grafana
一、先用命令行工具做最小监控 1.1 NVIDIA GPU:`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具,前提是已经安装好显卡驱动。 常见用法: 它最适合做: * 快速排查显存占用; * 看当前...
Prometheus 节点监控:部署 node-exporter 并抓取主机指标
一、node-exporter Node Exporter 是 Prometheus 官方提供的一个节点资源采集组件,可以用于收集服务器节点的数据,如 CPU频率信息、磁盘IO统计、剩余可用内存等等。 **部署创建:** 由于是针对...
Prometheus:kube-state-metrics和metrics-server
一、kube-state-metrics 1、介绍 Kube-state-metrics 是一个Kubernetes组件,它提供了一种将 Kubernetes 集群中各资源状态信息转化为可监控指标的方法,以帮助用户更好地理解和监控集群的健康状...
Alertmanager路由规则详解:分组、匹配与发送策略
一、Route 是 Alertmanager 中最关键的配置之一,它决定一条告警会如何分组、匹配到哪个子路由,以及最终发送给谁。本文围绕 group_by、match、match_re、matchers 和 continue 等字段讲清路由...
Prometheus 黑盒监控:外部域名的 HTTP 与 POST 探测
一、HTTP 监控(监控外部域名) 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-external-website` 任务 二、HTTP Post 监控(监控外部域名) 按...
ServiceMonitor发现不到监控目标时怎么排查
一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...











