排序
SkyWalking 部署实战:使用 Helm 在 Kubernetes 中安装
一、Helm方式部署 设置环境变量 helm添加仓库 把skywalking安装包拉取下来 单机部署es 单机部署遇到的问题: 解决方法: 修改values.yaml 部署&&升级 创建基于helm方式的ingress
Prometheus 自定义监控:接入云主机 Node Exporter
一、虚机数据抓取 1.1 配置安装node-exporter 验证数据收集: 1.2 配置prometheus-config.yaml 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `other-ECS` ...
Prometheus 黑盒监控:TCP 探测配置实战
一、TCP检测 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `service-tcp-probe` 任务 则需要在service上添加注释必须有以下三行 示例:Java应用的svc:
Filebeat实战:采集容器内日志与环境清理
一、使用Filebeat收集容器内的日志 有些程序在设计时,并没有符合云原生设计,也就是把程序的日志直接输出到了本地文件,此时如果也需要收集日志,可以在程序的 Pod 内,启动一个 Filebeat 的容...
LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案
一、EFK vs LPG **架构和组件:** - Loki:Loki 是一个开源的水平可扩展日志聚合系统,由 Promtail、Loki 和 Grafana 组成。 - EFK:EFK 是一个集成的解决方案,由 Elasticsearch、Fluentd 和 K...
Prometheus 对接 Alertmanager:告警配置与测试
一、Prometheus添加告警配置 修改ConfigMap资源文件prometheus-config.yaml,改动内容如下: - 添加AlertManager服务器地址 - 指定告警规则文件路径位置 - 添加Prometheus中触发告警的告警规则(...
Alertmanager 高级配置:接入钉钉告警与静默管理
一、基于钉钉的报警媒介 [自定义机器人安全设置 - 钉钉开放平台 (dingtalk.com)](https://open.dingtalk.com/document/robots/customize-robot-security-settings) [创建自定义机器人 - 钉钉开...
ServiceMonitor发现不到监控目标时怎么排查
一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...
Alertmanager配置文件解析:Global、Templates、Route、Inhibit与Receivers
一、想把 Alertmanager 用好,首先要读懂它的配置文件结构。本文结合示例配置,拆解 Global、Templates、Route、Inhibit Rules 和 Receivers 等核心块的职责与常见字段。 在介绍Alertmanager配...











