监控告警 第8页
AlertManager告警分组和告警抑制:告警分组-AI运维探索者

AlertManager告警分组和告警抑制:告警分组

一、为了避免告警轰炸,将同类型的告警规则定位一组,比如将所有硬件相关的都归类到hardware,包括负载、cpu使用率、内存使用率、硬盘等。 当此类告警被触发,在一个“group_wait”时间范围内,...
头像3年前
0387
Prometheus 自定义监控:接入 MySQL 指标-AI运维探索者

Prometheus 自定义监控:接入 MySQL 指标

一、自定义中间件监控 1.1 创建mysql监听用户并授权,注意服务ip不要填错 1.2 启动容器 1.2 启动监控容器 创建配置文件 启动容器并挂载配置 验证容器 1.2 可能遇到的问题 执行下面命令启动容器 ...
头像3年前
0527
Prometheus 告警规则实战:企业常用 Rules 汇总-AI运维探索者

Prometheus 告警规则实战:企业常用 Rules 汇总

一、前言 Prometheus中的告警规则允许你基于PromQL表达式定义告警触发条件,Prometheus 后端对这些触发规则进行周期性计算,当满足触发条件后则会触发告警通知。 在企业中,为了确保业务的稳定...
头像3年前
0417
Prometheus 集群监控:接入 etcd-AI运维探索者

Prometheus 集群监控:接入 etcd

一、**etcd** >由上可知,启动参数里面有一个 --listen-metrics-urls=http://127.0.0.1:2381 的配置,该参数就是来指定 Metrics 接口运行在 2381 端口下面的,而且是 http 的协议,所以也不...
头像3年前
0536
Prometheus 容器监控:接入 cAdvisor-AI运维探索者

Prometheus 容器监控:接入 cAdvisor

一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
头像3年前
0336
ElastAlert 告警实战:EFK 日志平台的监控与多规则告警-AI运维探索者

ElastAlert 告警实战:EFK 日志平台的监控与多规则告警

一、前言 1.1 产生背景 ElastAlert最初由Yelp开发并开源,旨在解决实时监控和告警的需求。由于Elasticsearch 的日志处理能力强大,许多组织和企业使用它来存储和分析大量的日志数据。然而,仅仅...
头像3年前
0286
Prometheus:使用PromQL查询监控指标-AI运维探索者

Prometheus:使用PromQL查询监控指标

一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言,其提供对时间序列数据丰富的查询,聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...
头像3年前
0536
Kubernetes全链路监控:Skywalking配置和使用-AI运维探索者

Kubernetes全链路监控:Skywalking配置和使用

一、部署一个java应用(在192.168.1.60主机操作)。 1.1 使用其中一个k8s节点master01,安装docker 1.2 安装git 1.3 克隆zrlog源码 1.4 编译 1.5 安装zrlog应用 查看容器 二、配置java应用 2.1 使...
头像3年前
0396
Kubernetes全链路监控:全链路监控Skywalking介绍-AI运维探索者

Kubernetes全链路监控:全链路监控Skywalking介绍

一、APM APM (Application Performance Management )应用性能管理 ,通过各种探针采集并上报数据,收集关键指标,同时搭配数据展示以实现对应用程序性能管理和故障管理的系统化解决方案。 目...
头像3年前
0426
Alertmanager 高级配置:接入企业微信告警-AI运维探索者

Alertmanager 高级配置:接入企业微信告警

一、基于企业微信的报警媒介 - **实时告警通知**:企业微信/钉钉等即时通信工具能够实现实时的告警通知,使得团队 成员能够及时响应和解决问题。 - **通知范围更广**:基于企业微信/钉钉的告警...
头像3年前
0526