可观测性与运维 第6页
Elasticsearch RPM部署实战:环境准备、单点上线与集群搭建-AI运维探索者

Elasticsearch RPM部署实战:环境准备、单点上线与集群搭建

一、环境准备 1.1 机器配置(3台) | CPU | 2C | |--------|------| | MEMORY | 4G | | DISK | 50G+ | 1.2 机器信息(3台) | 主机名 | 主机IP | |--------|---------------| | elk121 | 192.168.1....
黑盒监控和白盒监控有什么区别-AI运维探索者

黑盒监控和白盒监控有什么区别

一、什么是黑盒监控 黑盒监控是从外部视角对系统进行监控,类似于使用用户的角度观察系统。监控系统并不了解系统的内部工作方式,只关注对外部暴露的接口和功能的响应情况。黑盒监控主要通过发...
PrometheusAlert 入门:为什么需要告警消息转发平台-AI运维探索者

PrometheusAlert 入门:为什么需要告警消息转发平台

一、为什么要用PrometheusAlert? - 1.1 背景 - 通过configmap配置文件维护告警媒介辨析度低; - 部分快消息告警媒介需要额外部署webhook做转发; - alertmanager web UI 较简单,不足以展示更...
日志平台设计:如何搭建有价值的日志分析体系-AI运维探索者

日志平台设计:如何搭建有价值的日志分析体系

一、日志规范 在K8S架构中,为了统一和标准化日志格式,可以使用以下几种常见的日志规范: 1、日志格式规范: - 结构化日志:使用结构化日志格式,如JSON、XML 或 Key-Value Pair(键值 对)格...
Alertmanager 高级配置:接入钉钉告警与静默管理-AI运维探索者

Alertmanager 高级配置:接入钉钉告警与静默管理

一、基于钉钉的报警媒介 [自定义机器人安全设置 - 钉钉开放平台 (dingtalk.com)](https://open.dingtalk.com/document/robots/customize-robot-security-settings) [创建自定义机器人 - 钉钉开...
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
Filebeat与Loki日志收集方案分析-AI运维探索者

Filebeat与Loki日志收集方案分析

一、Filebeat 在早期的ELK架构中,日志收集均以Logstash为主,Logstash负责收集和解析日志,它对内存、CPU、IO资源的消耗比较高,但是Filebeat所占系统的CPU和内存几乎可以忽略不计。 由于Fileb...
SkyWalking 部署实战:控制器方式部署 OAP、UI 与 Elasticsearch-AI运维探索者

SkyWalking 部署实战:控制器方式部署 OAP、UI 与 Elasticsearch

一、认识skywalking组件 **Skywalking OAP Server**:Skywalking OAP Server 是 Skywalking 分析系统的核 心组件之一。 - 主要负责接收和处理来自 Skywalking Agent 的数据,并将数据存储到后端...
Filebeat实战:采集容器内日志与环境清理-AI运维探索者

Filebeat实战:采集容器内日志与环境清理

一、使用Filebeat收集容器内的日志 有些程序在设计时,并没有符合云原生设计,也就是把程序的日志直接输出到了本地文件,此时如果也需要收集日志,可以在程序的 Pod 内,启动一个 Filebeat 的容...
Prometheus+Alertmanager实战:MySQL连接失败告警-AI运维探索者

Prometheus+Alertmanager实战:MySQL连接失败告警

一、监控数据库 在实现告警之前,我们需要先实现监控。下面通过Exporter实现对数据库的监控: 具体如何实现对数据库的监控,可参考:[Prometheus实战---监控非云原生应用Mysql](https://zhuanla...