可观测性与运维 第3页
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
PromQL入门:基础语法与时间范围查询-AI运维探索者

PromQL入门:基础语法与时间范围查询

一、PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。 Prometheus ...
ELK与EFK日志收集架构分析-AI运维探索者

ELK与EFK日志收集架构分析

一、ELK架构 在传统架构中,比较成熟且流行的日志收集平台非ELK(Elasticsearch + Logstash + Kibana)莫属,其中Logstash负责采集日志,并输出至Elasticsearch,之后用Kibana进行展示。 缺点:...
Fluentd 高级配置:source、match、buffer、filter 与 label-AI运维探索者

Fluentd 高级配置:source、match、buffer、filter 与 label

一、配置文件 在 Fluentd 的配置文件中,有几个常用的关键字和组件,包括 source 、 match 、filter 、 system 、 label 和 @include 。 * 1.source :用于定义 Fluentd 接收数据的来源 * 2.mat...
Prometheus:AlertManager配置钉钉告警-AI运维探索者

Prometheus:AlertManager配置钉钉告警

一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...
Kibana集成Elasticsearch:部署、索引管理、开发者工具与KQL-AI运维探索者

Kibana集成Elasticsearch:部署、索引管理、开发者工具与KQL

一、kibana部署 1、下载软件包 地址链接: 2、安装kibana | \[root@elk123 ~\]rp
Prometheus:kube-state-metrics和metrics-server-AI运维探索者

Prometheus:kube-state-metrics和metrics-server

一、kube-state-metrics 1、介绍 Kube-state-metrics 是一个Kubernetes组件,它提供了一种将 Kubernetes 集群中各资源状态信息转化为可监控指标的方法,以帮助用户更好地理解和监控集群的健康状...
Kubernetes日志收集内容与技术栈概览-AI运维探索者

Kubernetes日志收集内容与技术栈概览

一、前言 本文主要以下几方面介绍k8s日志收集: * 日志收集内容 * 日志收集工具 * 日志收集架构分析 二、日志收集内容 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 ...
EFK 架构升级:Kafka + Logstash 支撑海量日志场景-AI运维探索者

EFK 架构升级:Kafka + Logstash 支撑海量日志场景

一、数据背景 在海量数据场景下,日志管理和分析是一项重要任务。为了解决这个问题,EFK 架构 (Elasticsearch + Fluentd + Kibana)已经成为流行的选择。 然而,随着数据规模的增加,传统的 EF...
Kubernetes日志收集基础:日志类型、技术栈与工具对比-AI运维探索者

Kubernetes日志收集基础:日志类型、技术栈与工具对比

一、有哪些日志需要收集管理? 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 * /var/log/messages * /var/log/kube-xxx.log * Kubernetes组件日志(/var/log/kube.*)...