可观测性与运维 第11页
Filebeat与Loki日志收集方案分析-AI运维探索者

Filebeat与Loki日志收集方案分析

一、Filebeat 在早期的ELK架构中,日志收集均以Logstash为主,Logstash负责收集和解析日志,它对内存、CPU、IO资源的消耗比较高,但是Filebeat所占系统的CPU和内存几乎可以忽略不计。 由于Fileb...
Blackbox Exporter监控域名实战-AI运维探索者

Blackbox Exporter监控域名实战

一、创建一个空文件,然后通过该文件创建一个 Secret,那么这个 Secret 即可作为 Prometheus 的静态配置 查看 Secret是否创建完成 二、创建完 Secret 后,需要编辑下 Prometheus 配置 三、参考[...
ECK实战:在Kubernetes中从零落地日志收集平台-AI运维探索者

ECK实战:在Kubernetes中从零落地日志收集平台

一、在K8s中从零落地日志收集平台 官方文档:https://www.elastic.co/docs/deploy-manage/deploy/cloud-on-k8s 1.1 ECK安装 参考链接:https://www.elastic.co/docs/deploy-manage/deploy/cloud...
Prometheus的Exporter-AI运维探索者

Prometheus的Exporter

一、Node Exporter Node Exporter主要用来采集主机上的各种指标(如CPU、内存、磁盘、网络等),Node exporter作为一个独立的进程在主机上运行,并通过HTTP端点暴露指标数据。Prometheus可以定...
Prometheus 容器监控:接入 cAdvisor-AI运维探索者

Prometheus 容器监控:接入 cAdvisor

一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
PrometheusRule怎么写:从Grafana面板到MySQL告警规则-AI运维探索者

PrometheusRule怎么写:从Grafana面板到MySQL告警规则

一、打开Mysql的Dashboard,点击【Edit】 二、复制相关PromQL语句 在此基础做相应修改 三、在Prometheus上测试即可 四、告警规则所需要的expr已经完成,接下来创建PrometheusRule即可 上面参数说...
SkyWalking 自定义告警:OAL 指标扩展与接口异常告警-AI运维探索者

SkyWalking 自定义告警:OAL 指标扩展与接口异常告警

- 一、为什么需要自定义告警? - 1、满足不同的监控需求; - 2、结合链路追踪及告警规则,更高效解决问题; 一、场景定义 1.1 需求 **场景描述**:公司主营业务为在线购物网站,那么 HTTP 服务...
Elasticsearch集群迁移实战:_reindex与Logstash跨集群同步-AI运维探索者

Elasticsearch集群迁移实战:_reindex与Logstash跨集群同步

一、部署ES6分布式集群 1、 2、结果验证 二、基于_reindex的API迁移 2.1 环境准备 1、搭建好两套多实例集群 2、在ES6环境创建文档 **注意:在Postman执行时需要单个单个执行,上面只是为了方便...
Alertmanager自定义邮件模板实战-AI运维探索者

Alertmanager自定义邮件模板实战

一、修改alertmanager-secret.yaml添加自定义模板 添加告警模板 **注意:wechat.tmpl和alertmanager.yaml需要对齐** 在templates字段添加模板位置 配置wechat-ops receiver使用该模板 配置警报重...
SkyWalking 高级告警配置:独立规则与复合规则-AI运维探索者

SkyWalking 高级告警配置:独立规则与复合规则

一、SkyWalking告警规则 [Alarm | Apache SkyWalking](https://skywalking.apache.org/docs/main/v9.0.0/en/setup/backend/backend-alarm/) 告警规则有两种类型,单独规则(Individual Rules)...