可观测性与运维 第3页
Fluentd 入门:安装方式、事件模型与基础过滤-AI运维探索者

Fluentd 入门:安装方式、事件模型与基础过滤

一、前言 Fluentd 是一个开源的日志收集和传输工具,用于可靠地收集、传输和处理各种类型的 日志数据。它被设计成具有灵活性和可扩展性,可以在复杂的日志处理场景中进行配置和定制。 以下是 Fl...
Zabbix Agent 与多场景监控实践-AI运维探索者

Zabbix Agent 与多场景监控实践

一、zabbix客户端概述 zabbix客户端 应用场景 <tbod
Kubernetes中高可用安装Prometheus实战-AI运维探索者

Kubernetes中高可用安装Prometheus实战

一、安装方式介绍 Prometheus 可以以多种方式进行安装和部署,适应不同的需求和环境。以下是一些常见的 Prometheus 安装方式(更多信息请参考[Prometheus官网](https://prometheus.io/docs/prome...
PrometheusRule怎么写:从Grafana面板到MySQL告警规则-AI运维探索者

PrometheusRule怎么写:从Grafana面板到MySQL告警规则

一、打开Mysql的Dashboard,点击【Edit】 二、复制相关PromQL语句 在此基础做相应修改 三、在Prometheus上测试即可 四、告警规则所需要的expr已经完成,接下来创建PrometheusRule即可 上面参数说...
SkyWalking 告警实战:默认规则、动态配置与告警媒介-AI运维探索者

SkyWalking 告警实战:默认规则、动态配置与告警媒介

一、基于Skywalking的告警概述 官方指南:[apache/skywalking · GitHub](https://github.com/apache/skywalking/blob/master/docs/en/setup/backend/backend-alarm.md) **基本原理&告警媒...
Elasticsearch运维进阶:多实例、Head、Postman与故障排查-AI运维探索者

Elasticsearch运维进阶:多实例、Head、Postman与故障排查

一、ES集群的多实例部署 1、在elk121节点上配置集群免密登录及同步脚本 在elk121节点上修改主机列表 在elk121节点上生成密钥对 | \[root@elk121 ~\]ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa -...
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
Prometheus:AlertManager配置企业微信告警-AI运维探索者

Prometheus:AlertManager配置企业微信告警

一、准备工作。 1.1 注册完成企业微信 步骤略 1.2 创建应用 点击【应用管理】-【创建应用】 填写【应用名称】、【应用介绍(选填)】并上传应用Logo后,点击【创建应用】 1.3 获取企业ID 点击【我...
Filebeat实战:在Kubernetes中收集和查询集群日志-AI运维探索者

Filebeat实战:在Kubernetes中收集和查询集群日志

一、使用Filebeat收集K8s日志 1.1 在K8s中一键部署Filebeat 参考链接:https://www.elastic.co/docs/deploy-manage/deploy/cloud-on-k8s/quickstart-beats 1.1 部署Filebeat 1、创建一个定义 Fi...
ECK日志采集核心:Beat资源与Filebeat配置详解-AI运维探索者

ECK日志采集核心:Beat资源与Filebeat配置详解

一、ECK核心资源Beat配置详解 ECK核心资源Beat配置示例: 1.1 FileBeat配置详解 1.1 FileBeat基于k8s自动发现配置 ECK核心资源FileBeat配置示例: 1.1 FileBeat基于inputs配置 ECK核心资源FileB...