监控告警 第4页
Prometheus:AlertManager配置邮件告警-AI运维探索者

Prometheus:AlertManager配置邮件告警

一、获取qq邮箱二维码。 点击【Settings】 点击【服务】 按照提示发送短信,获取授权码bcreknhkuijidifd 二、将Alertmanager的配置文件从configMap里导出来 三、编辑配置文件 删除无用配置,要...
头像3年前
0429
Prometheus 监控平台入门:架构、时序数据与适用场景-AI运维探索者

Prometheus 监控平台入门:架构、时序数据与适用场景

一、打造基于Prometheus的全方位监控平台 1.1 前言 **官网地址:**https://prometheus.io/docs/prometheus/latest/getting_started/ - 灵活的时间序列数据库; - 定制各式各样的监控规则; - Pr...
头像3年前
0426
Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API-AI运维探索者

Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API

一、使用Prometheus监控Jenkins 1.1 安装使用插件 - https://plugins.jenkins.io/prometheus/ Default namespace: **monitoring** **Prometheus安装的Namespace** **检查 Jenkins 暴露的 promth...
头像4年前
04111
Prometheus:使用Grafana实现监控指标可视化-AI运维探索者

Prometheus:使用Grafana实现监控指标可视化

一、安装grafana-10.1.4版本 前期准备工作:安装helm和SC 1、下载包 2、修改values.yaml (1)定义storageClass: 'nfs-client' (2)执行`/image:`搜索镜像,替换国外镜像为国内镜像 替换docker.io/...
头像3年前
04013
Prometheus入门:核心概念、应用场景与特性-AI运维探索者

Prometheus入门:核心概念、应用场景与特性

一、什么是Prometheus Prometheus是一个开源的系统监控和警报工具,用于收集和存储应用程序和系统的时间序列数据。它由SoundCloud开发并于2012年首次发布,后来成为Cloud Native Computing Foun...
头像3年前
03913
Zabbix 监控架构与版本生命周期梳理-AI运维探索者

Zabbix 监控架构与版本生命周期梳理

一、生命周期 zabbix生命周期版本选择: <img src="https://bucketbucket1.oss-cn-beijing.aliyuncs.com/imag/ed57658a4478_image1.png" style="wid
头像3年前
03913
Prometheus 黑盒监控:外部域名的 HTTP 与 POST 探测-AI运维探索者

Prometheus 黑盒监控:外部域名的 HTTP 与 POST 探测

一、HTTP 监控(监控外部域名) 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-external-website` 任务 二、HTTP Post 监控(监控外部域名) 按...
头像3年前
0398
PrometheusRule入门:概念、结构与关键字段解析-AI运维探索者

PrometheusRule入门:概念、结构与关键字段解析

一、PrometheusRule是什么 `PrometheusRule` 是 Prometheus Operator 中的一个自定义资源(Custom Resource),它用于定义 Prometheus 在监控系统中的规则和警报规则。 Prometheus 是一种开源的...
头像3年前
0398
Prometheus:AlertManager配置钉钉告警-AI运维探索者

Prometheus:AlertManager配置钉钉告警

一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...
头像3年前
03814
Alertmanager路由规则详解:分组、匹配与发送策略-AI运维探索者

Alertmanager路由规则详解:分组、匹配与发送策略

一、Route 是 Alertmanager 中最关键的配置之一,它决定一条告警会如何分组、匹配到哪个子路由,以及最终发送给谁。本文围绕 group_by、match、match_re、matchers 和 continue 等字段讲清路由...
头像3年前
03815