可观测性与运维-AI运维探索者-第12页

Prometheus：更新consul配置到Prometheus

一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加，如下。 **说明：因为consul-ui服务地址如果重启会发生变化，所以这里选择服务名** 二、重新导入配置三、重启Prometheus服务四...

# 监控告警 # Prometheus # 指标监控

3年前

0425

基于Kubernetes的日志收集系统：搭建Loki 日志收集系统

一、基于Loki 日志监控报警后续加

# Kubernetes # 云原生 # 日志采集

3年前

03114

Zabbix 6.x 生产部署快速实践指南

一、主机规划 1.1 推荐配置 Zabbix6.0官方配置要求: <col style="width: 19%

# 监控告警 # 运维实践 # 生产部署

3年前

0389

Kube-State-Metrics 入门：K8S 集群层监控的基础组件

一、KubeStateMetrics简介 kube-state-metrics 是一个 Kubernetes 组件，它通过查询 Kubernetes 的 API 服务器，收集关于 Kubernetes 中各种资源（如节点、pod、服务等）的状态信息，并将这些...

# Kubernetes # 云原生 # 监控告警

3年前

03813

PrometheusRule入门：概念、结构与关键字段解析

一、PrometheusRule是什么 `PrometheusRule` 是 Prometheus Operator 中的一个自定义资源（Custom Resource），它用于定义 Prometheus 在监控系统中的规则和警报规则。 Prometheus 是一种开源的...

# 监控告警 # Prometheus # 指标监控

3年前

0438

SkyWalking 入门：整体架构、APM 对比与核心特性

一、为什么需要链路追踪？随着云计算和微服务架构的普及，越来越多的企业开始采用分布式架构开发应用程序。在这种复杂的架构中，应用程序的性能问题变得更加棘手，传统的单机监测工具已经无法...

# 链路追踪 # Skywalking # APM

3年前

0449

Elasticsearch运维API实战：health、settings、allocation与reroute

一、ES集群健康状态API(health) 1、安装jq工具 2、测试取数据 (1)取全部数据相关数据说明：参数

# Elasticsearch # 搜索引擎 # 数据检索

3年前

04513

Prometheus 自动伸缩：Metrics Server 与 HPA 实战

一、背景 - Kubernetes集群规模大、动态变化快，而且容器化应用部署和服务治理机制的普及，传统的基础设施监控方式已经无法满足Kubernetes集群的监控需求。 - 需要使用专门针对Kubernetes集群...

# 监控告警 # Prometheus # 指标监控

3年前

03712

Prometheus：AlertManager介绍和安装

一、查看service 二、打开浏览器，输入http://192.168.1.31:32590访问即可

# 监控告警 # Prometheus # 指标监控

3年前

0509

Filebeat Sidecar收集自定义文件日志实践

一、前言 Filebeat是一个非常轻量级的日志收集工具，可以将其和应用程序部署至一个Pod中，通过Volume进行日志文件的共享，之后Filebeat即可采集里面的数据，并推送至日志平台。下面环境基于EFK...

# Kubernetes # 日志采集 # 日志分析

3年前

02413

上一页 1…10 111213 14 下一页跳转