监控告警共90篇
Prometheus 自动伸缩:Metrics Server 与 HPA 实战-AI运维探索者

Prometheus 自动伸缩:Metrics Server 与 HPA 实战

一、背景 - Kubernetes集群规模大、动态变化快,而且容器化应用部署和服务治理机制的普 及,传统的基础设施监控方式已经无法满足Kubernetes集群的监控需求。 - 需要使用专门针对Kubernetes集群...
头像3年前
03712
Prometheus:AlertManager介绍和安装-AI运维探索者

Prometheus:AlertManager介绍和安装

一、查看service 二、打开浏览器,输入http://192.168.1.31:32590访问即可
头像3年前
0509
Alertmanager入门:核心概念与主要功能-AI运维探索者

Alertmanager入门:核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后,Alertmanager 管理这些警报,包括沉默、抑制、聚合以及通过电子邮件、待命...
头像3年前
0265
Prometheus 黑盒监控:ICMP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:ICMP 探测配置实战

一、ICMP监控 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-http-services` 任务
头像3年前
0637
Prometheus:配置Prometheus告警规则-AI运维探索者

Prometheus:配置Prometheus告警规则

一、添加Prometheus告警规则 找到rules.yaml,将 rules.yaml: '{}' 改为以下内容 上面参数说明: * `groups` 是一个规则组的列表,每个规则组包含一组相关的告警规则。 * `name: hostStatsAlert...
头像3年前
02410
Kubernetes中高可用安装Prometheus实战-AI运维探索者

Kubernetes中高可用安装Prometheus实战

一、安装方式介绍 Prometheus 可以以多种方式进行安装和部署,适应不同的需求和环境。以下是一些常见的 Prometheus 安装方式(更多信息请参考[Prometheus官网](https://prometheus.io/docs/prome...
头像3年前
05115
PrometheusRule怎么写:从Grafana面板到MySQL告警规则-AI运维探索者

PrometheusRule怎么写:从Grafana面板到MySQL告警规则

一、打开Mysql的Dashboard,点击【Edit】 二、复制相关PromQL语句 在此基础做相应修改 三、在Prometheus上测试即可 四、告警规则所需要的expr已经完成,接下来创建PrometheusRule即可 上面参数说...
头像3年前
0339
Zabbix API、性能优化与高可用升级思路-AI运维探索者

Zabbix API、性能优化与高可用升级思路

一、zbx api 1.1 api概述 api Application Programming Interface 应用程序编程接口 (相当于是shell函数作用) api接口应用场景: 发送企业微信消息,人脸识别,短信验证,身份验证 使用第3方功能即...
头像3年前
03515
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
头像3年前
04814
Prometheus:AlertManager配置企业微信告警-AI运维探索者

Prometheus:AlertManager配置企业微信告警

一、准备工作。 1.1 注册完成企业微信 步骤略 1.2 创建应用 点击【应用管理】-【创建应用】 填写【应用名称】、【应用介绍(选填)】并上传应用Logo后,点击【创建应用】 1.3 获取企业ID 点击【我...
头像3年前
0247