可观测性与运维 第6页
Alertmanager路由规则详解:分组、匹配与发送策略-AI运维探索者

Alertmanager路由规则详解:分组、匹配与发送策略

一、Route 是 Alertmanager 中最关键的配置之一,它决定一条告警会如何分组、匹配到哪个子路由,以及最终发送给谁。本文围绕 group_by、match、match_re、matchers 和 continue 等字段讲清路由...
SkyWalking 链路追踪实战:Spring 微服务场景模拟与 UI 分析-AI运维探索者

SkyWalking 链路追踪实战:Spring 微服务场景模拟与 UI 分析

一、线上真实场景模拟(springboot微服务) 1.1 Springboot微服务 - UI服务 1.2 Springboot微服务 - office服务 1.3 Springboot微服务 - account服务 1.4 Springboot微服务 - customer服务 1.5 ...
Prometheus:使用Grafana实现监控指标可视化-AI运维探索者

Prometheus:使用Grafana实现监控指标可视化

一、安装grafana-10.1.4版本 前期准备工作:安装helm和SC 1、下载包 2、修改values.yaml (1)定义storageClass: 'nfs-client' (2)执行`/image:`搜索镜像,替换国外镜像为国内镜像 替换docker.io/...
PrometheusRule入门:概念、结构与关键字段解析-AI运维探索者

PrometheusRule入门:概念、结构与关键字段解析

一、PrometheusRule是什么 `PrometheusRule` 是 Prometheus Operator 中的一个自定义资源(Custom Resource),它用于定义 Prometheus 在监控系统中的规则和警报规则。 Prometheus 是一种开源的...
ECK日志采集核心:Beat资源与Filebeat配置详解-AI运维探索者

ECK日志采集核心:Beat资源与Filebeat配置详解

一、ECK核心资源Beat配置详解 ECK核心资源Beat配置示例: 1.1 FileBeat配置详解 1.1 FileBeat基于k8s自动发现配置 ECK核心资源FileBeat配置示例: 1.1 FileBeat基于inputs配置 ECK核心资源FileB...
Fluentd 高级配置:source、match、buffer、filter 与 label-AI运维探索者

Fluentd 高级配置:source、match、buffer、filter 与 label

一、配置文件 在 Fluentd 的配置文件中,有几个常用的关键字和组件,包括 source 、 match 、filter 、 system 、 label 和 @include 。 * 1.source :用于定义 Fluentd 接收数据的来源 * 2.mat...
Zabbix 监控架构与版本生命周期梳理-AI运维探索者

Zabbix 监控架构与版本生命周期梳理

一、生命周期 zabbix生命周期版本选择: <img src="https://bucketbucket1.oss-cn-beijing.aliyuncs.com/imag/ed57658a4478_image1.png" style="wid
读懂ServiceMonitor YAML:关键字段与配置示例-AI运维探索者

读懂ServiceMonitor YAML:关键字段与配置示例

一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
Elasticsearch中文检索与模板实战:IK分词器和索引模板-AI运维探索者

Elasticsearch中文检索与模板实战:IK分词器和索引模板

一、IK中文分词器 1.1 内置的标准分词器-分析英文 1、填写GET请求http://192.168.1.121:9200/\_analyze, 分析英文。观察到每个词正常被分开 <img src="https://bucketbucket1.oss-cn-be...
Kubernetes全链路监控:全链路监控Skywalking介绍-AI运维探索者

Kubernetes全链路监控:全链路监控Skywalking介绍

一、APM APM (Application Performance Management )应用性能管理 ,通过各种探针采集并上报数据,收集关键指标,同时搭配数据展示以实现对应用程序性能管理和故障管理的系统化解决方案。 目...