监控告警 第3页
读懂ServiceMonitor YAML:关键字段与配置示例-AI运维探索者

读懂ServiceMonitor YAML:关键字段与配置示例

一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
头像3年前
03712
Prometheus 告警规则实战:企业常用 Rules 汇总-AI运维探索者

Prometheus 告警规则实战:企业常用 Rules 汇总

一、前言 Prometheus中的告警规则允许你基于PromQL表达式定义告警触发条件,Prometheus 后端对这些触发规则进行周期性计算,当满足触发条件后则会触发告警通知。 在企业中,为了确保业务的稳定...
头像3年前
0387
Prometheus监控Etcd实战:证书、Service与ServiceMonitor-AI运维探索者

Prometheus监控Etcd实战:证书、Service与ServiceMonitor

一、Prometheus监控云原生应用流程 上面流程图说明: 针对云原生应用一般本身都存在一个/metrics接口,我们需要配置一个Service指向云原生应用(集群外部的应用需要应用Service指定具体IP)。同...
头像3年前
0515
Zabbix 配置详解与自定义监控实践-AI运维探索者

Zabbix 配置详解与自定义监控实践

一、zbx配置详解 1.1 服务端配置 文件目录 <tbody
头像3年前
02313
Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API-AI运维探索者

Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API

一、使用Prometheus监控Jenkins 1.1 安装使用插件 - https://plugins.jenkins.io/prometheus/ Default namespace: **monitoring** **Prometheus安装的Namespace** **检查 Jenkins 暴露的 promth...
头像4年前
04111
Prometheus 集群监控:接入 etcd-AI运维探索者

Prometheus 集群监控:接入 etcd

一、**etcd** >由上可知,启动参数里面有一个 --listen-metrics-urls=http://127.0.0.1:2381 的配置,该参数就是来指定 Metrics 接口运行在 2381 端口下面的,而且是 http 的协议,所以也不...
头像3年前
0516
Prometheus:使用Grafana实现监控指标可视化-AI运维探索者

Prometheus:使用Grafana实现监控指标可视化

一、安装grafana-10.1.4版本 前期准备工作:安装helm和SC 1、下载包 2、修改values.yaml (1)定义storageClass: 'nfs-client' (2)执行`/image:`搜索镜像,替换国外镜像为国内镜像 替换docker.io/...
头像3年前
04013
Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers-AI运维探索者

Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers

一、想把 Alertmanager 用好,首先要读懂它的配置文件结构。本文结合示例配置,拆解 Global、Templates、Route、Inhibit Rules 和 Receivers 等核心块的职责与常见字段。 在介绍Alertmanager配...
头像3年前
03315
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
头像3年前
04313
黑盒监控和白盒监控有什么区别-AI运维探索者

黑盒监控和白盒监控有什么区别

一、什么是黑盒监控 黑盒监控是从外部视角对系统进行监控,类似于使用用户的角度观察系统。监控系统并不了解系统的内部工作方式,只关注对外部暴露的接口和功能的响应情况。黑盒监控主要通过发...
头像3年前
02612