可观测性与运维 第4页
PromQL入门:基础语法与时间范围查询-AI运维探索者

PromQL入门:基础语法与时间范围查询

一、PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。 Prometheus ...
ELK与EFK日志收集架构分析-AI运维探索者

ELK与EFK日志收集架构分析

一、ELK架构 在传统架构中,比较成熟且流行的日志收集平台非ELK(Elasticsearch + Logstash + Kibana)莫属,其中Logstash负责采集日志,并输出至Elasticsearch,之后用Kibana进行展示。 缺点:...
Prometheus入门:核心概念、应用场景与特性-AI运维探索者

Prometheus入门:核心概念、应用场景与特性

一、什么是Prometheus Prometheus是一个开源的系统监控和警报工具,用于收集和存储应用程序和系统的时间序列数据。它由SoundCloud开发并于2012年首次发布,后来成为Cloud Native Computing Foun...
ServiceMonitor入门:定义、价值与工作机制-AI运维探索者

ServiceMonitor入门:定义、价值与工作机制

一、ServiceMonitor是什么 ServiceMonitor 是 Prometheus Operator 提供的一种 Kubernetes 自定义资源(Custom Resource),用于告诉 Prometheus 如何监控服务(Service)。它是 Prometheus Ope...
Zabbix 监控架构与版本生命周期梳理-AI运维探索者

Zabbix 监控架构与版本生命周期梳理

一、生命周期 zabbix生命周期版本选择: <img src="https://bucketbucket1.oss-cn-beijing.aliyuncs.com/imag/ed57658a4478_image1.png" style="wid
Prometheus 部署实战:在 Kubernetes 中搭建监控平台-AI运维探索者

Prometheus 部署实战:在 Kubernetes 中搭建监控平台

一、部署配置 整个监控体系涉及的技术栈较多,几乎可覆盖真实企业中的所有场景。主要技术栈如下: - Prometheus:监控主服务 - node-exporter:数据采集器 - kube-state-metrics:数据采集器 - ...
Prometheus:使用Grafana实现监控指标可视化-AI运维探索者

Prometheus:使用Grafana实现监控指标可视化

一、安装grafana-10.1.4版本 前期准备工作:安装helm和SC 1、下载包 2、修改values.yaml (1)定义storageClass: 'nfs-client' (2)执行`/image:`搜索镜像,替换国外镜像为国内镜像 替换docker.io/...
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
Zabbix 配置详解与自定义监控实践-AI运维探索者

Zabbix 配置详解与自定义监控实践

一、zbx配置详解 1.1 服务端配置 文件目录 <tbody
Skywalking:准备工作与版本信息-AI运维探索者

Skywalking:准备工作与版本信息

一、版本信息 Kubernetes 1.26.2 Skywalking 9.5.0 Elasticsearch 8.8.1