可观测性与运维 第2页
SkyWalking 告警实战:默认规则、动态配置与告警媒介-AI运维探索者

SkyWalking 告警实战:默认规则、动态配置与告警媒介

一、基于Skywalking的告警概述 官方指南:[apache/skywalking · GitHub](https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-alarm.md) **基本原理&告警媒...
Fluentd 案例实战:模式匹配与多场景配置示例-AI运维探索者

Fluentd 案例实战:模式匹配与多场景配置示例

一、案例分享 1.1 场景一 - 将 /root/my.txt文件中的日志数据按照指定的格式解析后,通过HTTP POST方法 发送到http://localhost:9090/地址。 - 发送的数据格式为JSON,每3秒发送一次。 fluentd...
Zabbix API、性能优化与高可用升级思路-AI运维探索者

Zabbix API、性能优化与高可用升级思路

一、zbx api 1.1 api概述 api Application Programming Interface 应用程序编程接口 (相当于是shell函数作用) api接口应用场景: 发送企业微信消息,人脸识别,短信验证,身份验证 使用第3方功能即...
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置-AI运维探索者

Prometheus Operator 优化:持久化、规则与 Alertmanager 配置

一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
SkyWalking 自定义告警:OAL 指标扩展与接口异常告警-AI运维探索者

SkyWalking 自定义告警:OAL 指标扩展与接口异常告警

- 一、为什么需要自定义告警? - 1、满足不同的监控需求; - 2、结合链路追踪及告警规则,更高效解决问题; 一、场景定义 1.1 需求 **场景描述**:公司主营业务为在线购物网站,那么 HTTP 服务...
PromQL实战:操作符与常用函数示例-AI运维探索者

PromQL实战:操作符与常用函数示例

一、PromQL 操作符 Prometheus 的查询语言支持基本的逻辑和算术运算符。对于两个即时向量之间的运算, 可以修改匹配行为。 Prometheus 中存在以下二元算术运算符: - `+` - `-` - `*` - `/` - `...
Zabbix 主机接入流程与常见故障排查-AI运维探索者

Zabbix 主机接入流程与常见故障排查

一、整体流程 1、安装客户端及修改配置文件,测试 2、web页面添加主机,关联模板 3、调试 二、配置客户端 1、配置zbx源 2、安装客户端 | \[root@zabbix-server01 ~\]yum install -y zabbix-agent...
Kibana集成Elasticsearch:部署、索引管理、开发者工具与KQL-AI运维探索者

Kibana集成Elasticsearch:部署、索引管理、开发者工具与KQL

一、kibana部署 1、下载软件包 地址链接: 2、安装kibana | \[root@elk123 ~\]rp
Prometheus:kube-state-metrics和metrics-server-AI运维探索者

Prometheus:kube-state-metrics和metrics-server

一、kube-state-metrics 1、介绍 Kube-state-metrics 是一个Kubernetes组件,它提供了一种将 Kubernetes 集群中各资源状态信息转化为可监控指标的方法,以帮助用户更好地理解和监控集群的健康状...
Kubernetes日志收集内容与技术栈概览-AI运维探索者

Kubernetes日志收集内容与技术栈概览

一、前言 本文主要以下几方面介绍k8s日志收集: * 日志收集内容 * 日志收集工具 * 日志收集架构分析 二、日志收集内容 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 ...