Prometheus共74篇
PromQL实战:操作符与常用函数示例-AI运维探索者

PromQL实战:操作符与常用函数示例

一、PromQL 操作符 Prometheus 的查询语言支持基本的逻辑和算术运算符。对于两个即时向量之间的运算, 可以修改匹配行为。 Prometheus 中存在以下二元算术运算符: - `+` - `-` - `*` - `/` - `...
Prometheus架构与指标采集机制解析-AI运维探索者

Prometheus架构与指标采集机制解析

一、Prometheus架构 Prometheus 生态系统由多个组件组成,其中架构图如下: 关于每个组件的用途如下: * **Prometheus Server(Prometheus 服务器):**Prometheus Server 是核心组件,负责数据...
Alertmanager路由规则详解:分组、匹配与发送策略-AI运维探索者

Alertmanager路由规则详解:分组、匹配与发送策略

一、Route 是 Alertmanager 中最关键的配置之一,它决定一条告警会如何分组、匹配到哪个子路由,以及最终发送给谁。本文围绕 group_by、match、match_re、matchers 和 continue 等字段讲清路由...
Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers-AI运维探索者

Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers

一、想把 Alertmanager 用好,首先要读懂它的配置文件结构。本文结合示例配置,拆解 Global、Templates、Route、Inhibit Rules 和 Receivers 等核心块的职责与常见字段。 在介绍Alertmanager配...
Alertmanager静默告警实战:计划内维护如何暂停通知-AI运维探索者

Alertmanager静默告警实战:计划内维护如何暂停通知

一、在计划内维护窗口,如果仍然持续接收告警通知,只会增加噪音并干扰判断。本文介绍如何通过 Alertmanager 的 Silence 功能为指定告警分组临时静默通知。 假如正在维护,我们不想一直收到告警...
Alertmanager 入门与部署:告警分组、抑制和邮件通知-AI运维探索者

Alertmanager 入门与部署:告警分组、抑制和邮件通知

一、Alertmanager简介 - 1.1 AlertManager常用的功能 - **抑制**:指的是当某一告警信息发送后,可以停止由此告警引发的其它告警,避免相 同的告警信息重复发送。 - **静默**:静默也是一种机制...
PrometheusAlert 部署实战:控制器部署与模板管理-AI运维探索者

PrometheusAlert 部署实战:控制器部署与模板管理

一、部署PrometheusAlert **获取企业微信机器人webhook的key值** * https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=9d8866d6-ab55-48f3-8336-786325667640 **为防止模版数据丢失,增加...
Kubernetes中高可用安装Prometheus实战-AI运维探索者

Kubernetes中高可用安装Prometheus实战

一、安装方式介绍 Prometheus 可以以多种方式进行安装和部署,适应不同的需求和环境。以下是一些常见的 Prometheus 安装方式(更多信息请参考[Prometheus官网](https://prometheus.io/docs/prome...
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置-AI运维探索者

Prometheus Operator 优化:持久化、规则与 Alertmanager 配置

一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
Prometheus:AlertManager配置钉钉告警-AI运维探索者

Prometheus:AlertManager配置钉钉告警

一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...