可观测性与运维 第2页
Prometheus监控MySQL实战:Exporter与ServiceMonitor配置-AI运维探索者

Prometheus监控MySQL实战:Exporter与ServiceMonitor配置

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
Skywalking:安装ElasticSearch-AI运维探索者

Skywalking:安装ElasticSearch

一、首先确认是否已经加载bitnami仓库。 如果没有,还需额外增加此仓库 二、下载ElasticSearch的chart包 三、安装ElasticSearch 注意:要保证K8S所有节点内存大于4G,否则ElasticSearch跑不动 3...
EFK技术栈收集Kubernetes日志实践-AI运维探索者

EFK技术栈收集Kubernetes日志实践

一、环境介绍 服务器可用资源 2 核 4G 以上 二、部署步骤 1.下载需要的部署文件 2.创建 EFK 所用的命名空间 3.创建 Elasticsearch 集群 4.创建 Kibana 5.在需要采集的主机上添加一个 NodeSelect...
Alertmanager 入门与部署:告警分组、抑制和邮件通知-AI运维探索者

Alertmanager 入门与部署:告警分组、抑制和邮件通知

一、Alertmanager简介 - 1.1 AlertManager常用的功能 - **抑制**:指的是当某一告警信息发送后,可以停止由此告警引发的其它告警,避免相 同的告警信息重复发送。 - **静默**:静默也是一种机制...
Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS-AI运维探索者

Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS

一、scheduler >由上可知,匹配pod对象,lable标签为component=kube-scheduler即可scheduler和controller-manager一样,默认监听0端口,需要注释 所有Master节点修改 `/etc/kubernetes/manif...
Prometheus:利用consul监控Nginx-AI运维探索者

Prometheus:利用consul监控Nginx

一、新起一个nginx pod。 查看 二、到pod里面安装vim,去配置一下status页 三、在Pod里面编辑配置文件 在最后面的 } 上面添加如下内容(可以使用shift+insert进行粘贴) 在Pod里面重新加载 四、在P...
Loki安装、查询语法与环境清理-AI运维探索者

Loki安装、查询语法与环境清理

一、前言 本文主要以下几方面介绍Loki: * Loki安装 * Loki语法 * Loki清理 二、Loki安装 提前下载好安装文件 1.创建独立命名空间 2.添加并更新 Loki 的 Helm 仓库 3.创建 Loki Stack 上面配置参...
日志平台设计:如何搭建有价值的日志分析体系-AI运维探索者

日志平台设计:如何搭建有价值的日志分析体系

一、日志规范 在K8S架构中,为了统一和标准化日志格式,可以使用以下几种常见的日志规范: 1、日志格式规范: - 结构化日志:使用结构化日志格式,如JSON、XML 或 Key-Value Pair(键值 对)格...
Blackbox Exporter监控域名实战-AI运维探索者

Blackbox Exporter监控域名实战

一、创建一个空文件,然后通过该文件创建一个 Secret,那么这个 Secret 即可作为 Prometheus 的静态配置 查看 Secret是否创建完成 二、创建完 Secret 后,需要编辑下 Prometheus 配置 三、参考[...
PrometheusAlert 对接 Alertmanager:路由与测试验证-AI运维探索者

PrometheusAlert 对接 Alertmanager:路由与测试验证

一、配置Alertmanager接入PrometheusAlert 更新alertmanager配置,将所有的告警均指向告警分发平台 接口说明: 热加载alertmanager服务: 二、测试验证 验证所有的告警是否发送到指定的群组: ...