可观测性与运维 第6页
Skywalking:准备工作与版本信息-AI运维探索者

Skywalking:准备工作与版本信息

一、版本信息 Kubernetes 1.26.2 Skywalking 9.5.0 Elasticsearch 8.8.1
EFK 部署实战:Fluentd 原理与在 K8S 中采集容器日志-AI运维探索者

EFK 部署实战:Fluentd 原理与在 K8S 中采集容器日志

一、Fluentd采集组件 1.1 前言 Fluentd 是一个高效的日志聚合器,是用 Ruby 编写的,并且可以很好地扩展。对于大 部分企业来说,Fluentd 足够高效并且消耗的资源相对较少。 另外一个工具 Fluent...
Prometheus 集群监控:接入 kube-apiserver 与 controller-manager-AI运维探索者

Prometheus 集群监控:接入 kube-apiserver 与 controller-manager

一、新增 Kubernetes 集群架构监控 在 `prometheus-config.yaml` 一次添加如下采集数据: 1.1 **kube-apiserver** 需要注意的是使用https访问时,需要tls相关配置,可以指定ca证书路径或者 `ins...
Prometheus:使用PromQL查询监控指标-AI运维探索者

Prometheus:使用PromQL查询监控指标

一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言,其提供对时间序列数据丰富的查询,聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...
Loki 场景实践:虚机日志、Java 应用日志与生产优化-AI运维探索者

Loki 场景实践:虚机日志、Java 应用日志与生产优化

- 一、背景 - 非K8S集群节点,单独部署某个特殊应用或Job的虚机; - 各个应用间的日志数据非同一目录; - 当前K8S环境中已经部署了Loki日志管理系统; 一、非K8S集群虚机日志收集 1.1 安装和配...
多种日志收集方案:应用日志、Pod 日志与 Sidecar 实践-AI运维探索者

多种日志收集方案:应用日志、Pod 日志与 Sidecar 实践

一、前言 集群级/应用日志通过将日志数据从容器或节点中解耦,并将其发送到集中的日志存储或处理系统,使日志数据在整个集群中可见。 **优势**:即使容器或节点发生故障,仍然可以访问日志数据...
Alertmanager静默告警实战:计划内维护如何暂停通知-AI运维探索者

Alertmanager静默告警实战:计划内维护如何暂停通知

一、在计划内维护窗口,如果仍然持续接收告警通知,只会增加噪音并干扰判断。本文介绍如何通过 Alertmanager 的 Silence 功能为指定告警分组临时静默通知。 假如正在维护,我们不想一直收到告警...
PrometheusAlert 入门:为什么需要告警消息转发平台-AI运维探索者

PrometheusAlert 入门:为什么需要告警消息转发平台

一、为什么要用PrometheusAlert? - 1.1 背景 - 通过configmap配置文件维护告警媒介辨析度低; - 部分快消息告警媒介需要额外部署webhook做转发; - alertmanager web UI 较简单,不足以展示更...
Kubernetes全链路监控:Skywalking配置和使用-AI运维探索者

Kubernetes全链路监控:Skywalking配置和使用

一、部署一个java应用(在192.168.1.60主机操作)。 1.1 使用其中一个k8s节点master01,安装docker 1.2 安装git 1.3 克隆zrlog源码 1.4 编译 1.5 安装zrlog应用 查看容器 二、配置java应用 2.1 使...
Elasticsearch二进制部署实战:集群搭建、systemd管理与堆内存调优-AI运维探索者

Elasticsearch二进制部署实战:集群搭建、systemd管理与堆内存调优

一、单点部署 1、下载ES软件包 地址链接:https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.5-linux-x86_64.tar.gz <img src="https://bucketbucket1.oss-cn-...