运维实践共45篇
ZooKeeper 实战:部署方式与客户端访问-AI运维探索者

ZooKeeper 实战:部署方式与客户端访问

一、ZooKeeper 安装 Zookeeper 支持多种安装方法 - 包 - 二进制 - 容器 https://hub.docker.com/_/zookeeper 1.1 ZooKeeper 单机部署 单机版的 ZooKeeper 安装 官方文档: https://zookeeper.apa...
头像1年前
03115
Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers-AI运维探索者

Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers

一、想把 Alertmanager 用好,首先要读懂它的配置文件结构。本文结合示例配置,拆解 Global、Templates、Route、Inhibit Rules 和 Receivers 等核心块的职责与常见字段。 在介绍Alertmanager配...
头像3年前
03315
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置-AI运维探索者

Prometheus Operator 优化:持久化、规则与 Alertmanager 配置

一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
头像3年前
03015
SkyWalking 告警实战:默认规则、动态配置与告警媒介-AI运维探索者

SkyWalking 告警实战:默认规则、动态配置与告警媒介

一、基于Skywalking的告警概述 官方指南:[apache/skywalking · GitHub](https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-alarm.md) **基本原理&告警媒...
头像3年前
03215
Fluentd 案例实战:模式匹配与多场景配置示例-AI运维探索者

Fluentd 案例实战:模式匹配与多场景配置示例

一、案例分享 1.1 场景一 - 将 /root/my.txt文件中的日志数据按照指定的格式解析后,通过HTTP POST方法 发送到http://localhost:9090/地址。 - 发送的数据格式为JSON,每3秒发送一次。 fluentd...
头像3年前
04015
Nacos 实战案例:服务注册、配置管理与监控-AI运维探索者

Nacos 实战案例:服务注册、配置管理与监控

一、Prometheus 监控 默认没有开启Prometheus监控, 1.1 配置打开Promethues 监控功能 1.2 配置 Prometheus 监控 Nacos https://github.com/nacos-group/nacos-docker/tree/master/example/prom...
头像1年前
04614
Tomcat快速上手:JDK安装、Tomcat部署与启动验证-AI运维探索者

Tomcat快速上手:JDK安装、Tomcat部署与启动验证

一、部署 Tomcat 前需要准备什么 这里的环境准备非常明确: | 主机 | 地址 | 角色 | | --- | --- | --- | | `web01` | `192.168.1.20 / 172.16.1.20` | Tomcat | | `web02` | `192.168.1.22 / 1...
头像5年前
02914
Fluentd 高级配置:source、match、buffer、filter 与 label-AI运维探索者

Fluentd 高级配置:source、match、buffer、filter 与 label

一、配置文件 在 Fluentd 的配置文件中,有几个常用的关键字和组件,包括 source 、 match 、filter 、 system 、 label 和 @include 。 * 1.source :用于定义 Fluentd 接收数据的来源 * 2.mat...
头像3年前
04014
Prometheus静态配置监控Windows主机实战-AI运维探索者

Prometheus静态配置监控Windows主机实战

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
头像3年前
04314
Zabbix 配置详解与自定义监控实践-AI运维探索者

Zabbix 配置详解与自定义监控实践

一、zbx配置详解 1.1 服务端配置 文件目录 <tbody
头像3年前
02313