可观测性与运维 第14页
Filebeat Sidecar收集自定义文件日志实践-AI运维探索者

Filebeat Sidecar收集自定义文件日志实践

一、前言 Filebeat是一个非常轻量级的日志收集工具,可以将其和应用程序部署至一个Pod中,通过Volume进行日志文件的共享,之后Filebeat即可采集里面的数据,并推送至日志平台。 下面环境基于EFK...
Alertmanager入门:核心概念与主要功能-AI运维探索者

Alertmanager入门:核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后,Alertmanager 管理这些警报,包括沉默、抑制、聚合以及通过电子邮件、待命...
AlertManager告警分组和告警抑制:抑制-AI运维探索者

AlertManager告警分组和告警抑制:抑制

一、示例1: 将如下配置增加到alertmanager_config.yaml里 **说明:当集群中的某一个主机节点异常宕机导致告警NodeDown被触发,同时在告警规则中定义了告警级别severity=Critical。由于主机异常...
Prometheus 黑盒监控:K8S 内部 HTTP 探测-AI运维探索者

Prometheus 黑盒监控:K8S 内部 HTTP 探测

一、HTTP 监控(K8S 内部发现方法) 1.1 自定义发现 `Service` 监控 `端口` 和 `路径` 可以如下设置: 然后,需要在 `Service` 中配置这样的 `annotation` : 示例:Java应用的svc: 按上面方法...
Skywalking:安装Skywalking-AI运维探索者

Skywalking:安装Skywalking

一、在master01节点上添加repo。 二、下载chart 三、修改values.yaml 3.1 第7行修改host和第12行关闭es 3.2 调整oap处的镜像tag、内存、sc类型、副本数 第145行修改tag为9.5.0 第147行修改内存...
Prometheus:配置Prometheus告警规则-AI运维探索者

Prometheus:配置Prometheus告警规则

一、添加Prometheus告警规则 找到rules.yaml,将 rules.yaml: '{}' 改为以下内容 上面参数说明: * `groups` 是一个规则组的列表,每个规则组包含一组相关的告警规则。 * `name: hostStatsAlert...
Prometheus:AlertManager配置企业微信告警-AI运维探索者

Prometheus:AlertManager配置企业微信告警

一、准备工作。 1.1 注册完成企业微信 步骤略 1.2 创建应用 点击【应用管理】-【创建应用】 填写【应用名称】、【应用介绍(选填)】并上传应用Logo后,点击【创建应用】 1.3 获取企业ID 点击【我...
EFK 架构升级:Kafka + Logstash 支撑海量日志场景-AI运维探索者

EFK 架构升级:Kafka + Logstash 支撑海量日志场景

一、数据背景 在海量数据场景下,日志管理和分析是一项重要任务。为了解决这个问题,EFK 架构 (Elasticsearch + Fluentd + Kibana)已经成为流行的选择。 然而,随着数据规模的增加,传统的 EF...
Grafana 监控大盘实战:部署、数据源与企业看板-AI运维探索者

Grafana 监控大盘实战:部署、数据源与企业看板

一、Grafana简述 Grafana 是一个开源的度量分析与可视化工具。提供查询、可视化、报警和指标展示等 功能,能灵活创建图表、仪表盘等可视化界面。 **主要功能:** - **可视化**: 提供多种可选择...