运维实践共45篇
Prometheus 黑盒监控:ICMP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:ICMP 探测配置实战

一、ICMP监控 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-http-services` 任务
头像3年前
0527
Zabbix 邮件与企业微信告警配置实战-AI运维探索者

Zabbix 邮件与企业微信告警配置实战

一、告警分类 | 报警方式 | 企业应用场景 | |--------------------------------------|--------------------------------------------------| | 发邮件 | 企业邮箱,免费使用 | | 企业微信-告警...
头像3年前
04810
Kafka 部署实战:单机、集群与 KRaft 模式-AI运维探索者

Kafka 部署实战:单机、集群与 KRaft 模式

一、Kafka 部署 1.1 Kafka 部署说明 kafka 版本选择 kafka 基于scala语言实现,所以使用kafka需要指定scala的相应的版本.kafka 为多个版本的Scala构建。这仅在使用 Scala 时才重要,并且希望为使...
头像1年前
0487
Sersync部署与联调测试:confxml配置、启动命令、文件新增删除同步验证-AI运维探索者

Sersync部署与联调测试:confxml配置、启动命令、文件新增删除同步验证

一、Sersync 部署前先明确它监听什么目录 结合前面的环境搭建,Sersync 运行在 `nfs01` 上,监听的核心目录就是: - `/data/` 这是因为: - `gitlab-01` 通过 NFS 把远端 `/data/` 挂载成本地 `...
Alertmanager 高级配置:接入企业微信告警-AI运维探索者

Alertmanager 高级配置:接入企业微信告警

一、基于企业微信的报警媒介 - **实时告警通知**:企业微信/钉钉等即时通信工具能够实现实时的告警通知,使得团队 成员能够及时响应和解决问题。 - **通知范围更广**:基于企业微信/钉钉的告警...
头像3年前
0486
Sersync实时同步环境搭建:Rsync服务端客户端与NFS共享目录部署实战-AI运维探索者

Sersync实时同步环境搭建:Rsync服务端客户端与NFS共享目录部署实战

一、先看清三台机器分别扮演什么角色 这里在“极速上手指南”里给出了完整环境说明: | 主机 | 角色 | | --- | --- | | `harbor01` | Rsync 服务端 | | `nfs01` | Rsync 客户端 / NFS 服务端 | ...
Nacos 实战案例:服务注册、配置管理与监控-AI运维探索者

Nacos 实战案例:服务注册、配置管理与监控

一、Prometheus 监控 默认没有开启Prometheus监控, 1.1 配置打开Promethues 监控功能 1.2 配置 Prometheus 监控 Nacos https://github.com/nacos-group/nacos-docker/tree/master/example/prom...
头像1年前
04614
生产级日志平台架构:亿级流量场景与云原生日志采集方案-AI运维探索者

生产级日志平台架构:亿级流量场景与云原生日志采集方案

一、生产级亿级流量日志平台架构解析 1.1 生产级亿级流量日志平台架构图 1.1 架构核心组件及流程 1、日志生成层(Kubernetes + e-service) * **Kubernetes** 作为容器编排平台,管理业务微服务...
头像3年前
0466
全网定时备份项目入门:需求分析、Rsync服务端客户端部署与免密推送-AI运维探索者

全网定时备份项目入门:需求分析、Rsync服务端客户端部署与免密推送

一、为什么企业里一定要做全网备份 这里从一个很典型的运维场景切入:领导一句“网站数据需要备份,你去做下”,后面其实是一整套需要你自己规划的体系。 真正落地时,至少要回答下面这些问题:...
部署Sersync服务并实时备份NFS-AI运维探索者

部署Sersync服务并实时备份NFS

一、前言 本文主要介绍部署Sersync服务并实现实时备份NFS。涉及Rsync服务端、Rsync客户端及NFS客户端共三台机器,具体如下: | 主机 | 角色 | | --------- | --------------------- | | harbor0...