监控告警 第5页
Zabbix API、性能优化与高可用升级思路-AI运维探索者

Zabbix API、性能优化与高可用升级思路

一、zbx api 1.1 api概述 api Application Programming Interface 应用程序编程接口 (相当于是shell函数作用) api接口应用场景: 发送企业微信消息,人脸识别,短信验证,身份验证 使用第3方功能即...
头像3年前
03515
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
头像3年前
04814
Prometheus:AlertManager配置企业微信告警-AI运维探索者

Prometheus:AlertManager配置企业微信告警

一、准备工作。 1.1 注册完成企业微信 步骤略 1.2 创建应用 点击【应用管理】-【创建应用】 填写【应用名称】、【应用介绍(选填)】并上传应用Logo后,点击【创建应用】 1.3 获取企业ID 点击【我...
头像3年前
0247
AlertManager告警分组和告警抑制:告警分组-AI运维探索者

AlertManager告警分组和告警抑制:告警分组

一、为了避免告警轰炸,将同类型的告警规则定位一组,比如将所有硬件相关的都归类到hardware,包括负载、cpu使用率、内存使用率、硬盘等。 当此类告警被触发,在一个“group_wait”时间范围内,...
头像3年前
0387
Prometheus 黑盒监控:Ingress 服务探测-AI运维探索者

Prometheus 黑盒监控:Ingress 服务探测

一、Ingress服务的探测(视频中未讲到,扩展+) 则需要在ingress上添加注释必须有以下三行 示例:Java应用的ing:
头像3年前
05110
PromQL入门:基础语法与时间范围查询-AI运维探索者

PromQL入门:基础语法与时间范围查询

一、PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。 Prometheus ...
头像3年前
04014
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置-AI运维探索者

Prometheus Operator 优化:持久化、规则与 Alertmanager 配置

一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
头像3年前
03715
Prometheus介绍和安装-AI运维探索者

Prometheus介绍和安装

一、Prometheus介绍 **Prometheus定义** Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维...
头像3年前
06010
Zabbix 主机接入流程与常见故障排查-AI运维探索者

Zabbix 主机接入流程与常见故障排查

一、整体流程 1、安装客户端及修改配置文件,测试 2、web页面添加主机,关联模板 3、调试 二、配置客户端 1、配置zbx源 2、安装客户端 | \[root@zabbix-server01 ~\]yum install -y zabbix-agent...
头像3年前
04915
Prometheus 自定义监控:接入 MySQL 指标-AI运维探索者

Prometheus 自定义监控:接入 MySQL 指标

一、自定义中间件监控 1.1 创建mysql监听用户并授权,注意服务ip不要填错 1.2 启动容器 1.2 启动监控容器 创建配置文件 启动容器并挂载配置 验证容器 1.2 可能遇到的问题 执行下面命令启动容器 ...
头像3年前
0527