运维实践 第3页
Prometheus:配置Prometheus告警规则-AI运维探索者

Prometheus:配置Prometheus告警规则

一、添加Prometheus告警规则 找到rules.yaml,将 rules.yaml: '{}' 改为以下内容 上面参数说明: * `groups` 是一个规则组的列表,每个规则组包含一组相关的告警规则。 * `name: hostStatsAlert...
头像3年前
02410
剖析CIFS协议-AI运维探索者

剖析CIFS协议

一、简介 SMB协议(也叫CIFS)是一种Windows上使用的共享协议。分为三个版本:SMB、SMB2和SMB3。 二、CIFS工作方式 1、基于TCP构建三次握手 2、协商:客户端把自己支持的所有CIFS版本都发送给服务器...
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置-AI运维探索者

Prometheus Operator 优化:持久化、规则与 Alertmanager 配置

一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
头像3年前
03715
Linux实时同步服务入门:为什么需要实时同步、Sersync原理与架构选择-AI运维探索者

Linux实时同步服务入门:为什么需要实时同步、Sersync原理与架构选择

一、为什么网站架构里会需要实时同步 这里先把问题背景说得很清楚: - 之前已经通过 `rsync + 定时任务` 实现了定时备份或定时同步 - 但对于 `NFS` 这类共享存储场景,往往需要更实时的数据同步...
读懂ServiceMonitor YAML:关键字段与配置示例-AI运维探索者

读懂ServiceMonitor YAML:关键字段与配置示例

一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
头像3年前
04212
网站存储服务入门:为什么需要存储、存储分类与NFS工作原理-AI运维探索者

网站存储服务入门:为什么需要存储、存储分类与NFS工作原理

一、为什么网站架构里需要独立存储 这里对存储服务的定位很明确:它主要用于存放用户上传的内容,通常处在网站架构靠后的数据层位置。 如果没有独立存储,用户上传的数据往往会直接落在某一台 W...
Prometheus 对接 Alertmanager:告警配置与测试-AI运维探索者

Prometheus 对接 Alertmanager:告警配置与测试

一、Prometheus添加告警配置 修改ConfigMap资源文件prometheus-config.yaml,改动内容如下: - 添加AlertManager服务器地址 - 指定告警规则文件路径位置 - 添加Prometheus中触发告警的告警规则(...
头像3年前
0379
NFS协议解析-AI运维探索者

NFS协议解析

一、NFS介绍 NFS就是网络上的文件系统,NFS服务器提供了/code和/document两个共享目录,分别被挂载到多台客户端的本地目录上。当用户在这些本地目录读写文件时,实际是在NFS服务器上读写。 NFS...
Kubernetes全链路监控:Skywalking配置和使用-AI运维探索者

Kubernetes全链路监控:Skywalking配置和使用

一、部署一个java应用(在192.168.1.60主机操作)。 1.1 使用其中一个k8s节点master01,安装docker 1.2 安装git 1.3 克隆zrlog源码 1.4 编译 1.5 安装zrlog应用 查看容器 二、配置java应用 2.1 使...
头像3年前
0396
部署rsync服务并定时备份-AI运维探索者

部署rsync服务并定时备份

一、前言 本文主要介绍部署Rsync服务并实现定时备份。 二、部署Rsync服务 2.1 服务端 1、检测是否安装 如果没有,则通过以下命令进行下载 2、编辑/etc/rsyncd.conf配置文件 3、检查 检查进程 检...