可观测性与运维 第8页
Prometheus 黑盒监控:TCP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:TCP 探测配置实战

一、TCP检测 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `service-tcp-probe` 任务 则需要在service上添加注释必须有以下三行 示例:Java应用的svc:
LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案-AI运维探索者

LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案

一、EFK vs LPG **架构和组件:** - Loki:Loki 是一个开源的水平可扩展日志聚合系统,由 Promtail、Loki 和 Grafana 组成。 - EFK:EFK 是一个集成的解决方案,由 Elasticsearch、Fluentd 和 K...
Kubernetes全链路监控:Skywalking配置和使用-AI运维探索者

Kubernetes全链路监控:Skywalking配置和使用

一、部署一个java应用(在192.168.1.60主机操作)。 1.1 使用其中一个k8s节点master01,安装docker 1.2 安装git 1.3 克隆zrlog源码 1.4 编译 1.5 安装zrlog应用 查看容器 二、配置java应用 2.1 使...
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
Prometheus 自定义监控:接入云主机 Node Exporter-AI运维探索者

Prometheus 自定义监控:接入云主机 Node Exporter

一、虚机数据抓取 1.1 配置安装node-exporter 验证数据收集: 1.2 配置prometheus-config.yaml 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `other-ECS` ...
Loki 场景实践:虚机日志、Java 应用日志与生产优化-AI运维探索者

Loki 场景实践:虚机日志、Java 应用日志与生产优化

- 一、背景 - 非K8S集群节点,单独部署某个特殊应用或Job的虚机; - 各个应用间的日志数据非同一目录; - 当前K8S环境中已经部署了Loki日志管理系统; 一、非K8S集群虚机日志收集 1.1 安装和配...
ECK入门与核心资源:Elasticsearch、Kibana和Logstash配置详解-AI运维探索者

ECK入门与核心资源:Elasticsearch、Kibana和Logstash配置详解

一、云原生日志框架ECK介绍 官网链接:[Elastic Cloud on Kubernetes | Elastic Docs](https://www.elastic.co/docs/deploy-manage/deploy/cloud-on-k8s) Elastic Cloud on Kubernetes(CCK)是El...
Zabbix 6.x 生产部署快速实践指南-AI运维探索者

Zabbix 6.x 生产部署快速实践指南

一、主机规划 1.1 推荐配置 Zabbix6.0官方配置要求: <col style="width: 19%
Kube-State-Metrics 入门:K8S 集群层监控的基础组件-AI运维探索者

Kube-State-Metrics 入门:K8S 集群层监控的基础组件

一、KubeStateMetrics简介 kube-state-metrics 是一个 Kubernetes 组件,它通过查询 Kubernetes 的 API 服务 器,收集关于 Kubernetes 中各种资源(如节点、pod、服务等)的状态信息,并将这些...
AlertManager告警分组和告警抑制:告警分组-AI运维探索者

AlertManager告警分组和告警抑制:告警分组

一、为了避免告警轰炸,将同类型的告警规则定位一组,比如将所有硬件相关的都归类到hardware,包括负载、cpu使用率、内存使用率、硬盘等。 当此类告警被触发,在一个“group_wait”时间范围内,...