可观测性与运维 第9页
SkyWalking 部署实战:使用 Helm 在 Kubernetes 中安装-AI运维探索者

SkyWalking 部署实战:使用 Helm 在 Kubernetes 中安装

一、Helm方式部署 设置环境变量 helm添加仓库 把skywalking安装包拉取下来 单机部署es 单机部署遇到的问题: 解决方法: 修改values.yaml 部署&&升级 创建基于helm方式的ingress
Prometheus 自定义监控:接入云主机 Node Exporter-AI运维探索者

Prometheus 自定义监控:接入云主机 Node Exporter

一、虚机数据抓取 1.1 配置安装node-exporter 验证数据收集: 1.2 配置prometheus-config.yaml 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `other-ECS` ...
Prometheus 黑盒监控:TCP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:TCP 探测配置实战

一、TCP检测 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `service-tcp-probe` 任务 则需要在service上添加注释必须有以下三行 示例:Java应用的svc:
Filebeat实战:采集容器内日志与环境清理-AI运维探索者

Filebeat实战:采集容器内日志与环境清理

一、使用Filebeat收集容器内的日志 有些程序在设计时,并没有符合云原生设计,也就是把程序的日志直接输出到了本地文件,此时如果也需要收集日志,可以在程序的 Pod 内,启动一个 Filebeat 的容...
LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案-AI运维探索者

LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案

一、EFK vs LPG **架构和组件:** - Loki:Loki 是一个开源的水平可扩展日志聚合系统,由 Promtail、Loki 和 Grafana 组成。 - EFK:EFK 是一个集成的解决方案,由 Elasticsearch、Fluentd 和 K...
Prometheus 对接 Alertmanager:告警配置与测试-AI运维探索者

Prometheus 对接 Alertmanager:告警配置与测试

一、Prometheus添加告警配置 修改ConfigMap资源文件prometheus-config.yaml,改动内容如下: - 添加AlertManager服务器地址 - 指定告警规则文件路径位置 - 添加Prometheus中触发告警的告警规则(...
Alertmanager 高级配置:接入钉钉告警与静默管理-AI运维探索者

Alertmanager 高级配置:接入钉钉告警与静默管理

一、基于钉钉的报警媒介 [自定义机器人安全设置 - 钉钉开放平台 (dingtalk.com)](https://open.dingtalk.com/document/robots/customize-robot-security-settings) [创建自定义机器人 - 钉钉开...
ServiceMonitor发现不到监控目标时怎么排查-AI运维探索者

ServiceMonitor发现不到监控目标时怎么排查

一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...
Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers-AI运维探索者

Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers

一、想把 Alertmanager 用好,首先要读懂它的配置文件结构。本文结合示例配置,拆解 Global、Templates、Route、Inhibit Rules 和 Receivers 等核心块的职责与常见字段。 在介绍Alertmanager配...
Skywalking:准备工作与版本信息-AI运维探索者

Skywalking:准备工作与版本信息

一、版本信息 Kubernetes 1.26.2 Skywalking 9.5.0 Elasticsearch 8.8.1