可观测性 第4页
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
头像3年前
03611
Kube-State-Metrics 入门:K8S 集群层监控的基础组件-AI运维探索者

Kube-State-Metrics 入门:K8S 集群层监控的基础组件

一、KubeStateMetrics简介 kube-state-metrics 是一个 Kubernetes 组件,它通过查询 Kubernetes 的 API 服务 器,收集关于 Kubernetes 中各种资源(如节点、pod、服务等)的状态信息,并将这些...
头像3年前
03513
Prometheus Operator 自定义监控:Helm 版 Ingress-Nginx-AI运维探索者

Prometheus Operator 自定义监控:Helm 版 Ingress-Nginx

一、自定义资源 Prometheus-operator 通过定期循环watch apiserver,获取到CRD资源(比如 servicemonitor)的创建或者更新,将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...
头像3年前
0355
Prometheus 自定义监控:接入云主机 Node Exporter-AI运维探索者

Prometheus 自定义监控:接入云主机 Node Exporter

一、虚机数据抓取 1.1 配置安装node-exporter 验证数据收集: 1.2 配置prometheus-config.yaml 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `other-ECS` ...
头像3年前
03410
Prometheus 黑盒监控:TCP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:TCP 探测配置实战

一、TCP检测 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `service-tcp-probe` 任务 则需要在service上添加注释必须有以下三行 示例:Java应用的svc:
头像3年前
03410
LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案-AI运维探索者

LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案

一、EFK vs LPG **架构和组件:** - Loki:Loki 是一个开源的水平可扩展日志聚合系统,由 Promtail、Loki 和 Grafana 组成。 - EFK:EFK 是一个集成的解决方案,由 Elasticsearch、Fluentd 和 K...
头像3年前
0346
ServiceMonitor发现不到监控目标时怎么排查-AI运维探索者

ServiceMonitor发现不到监控目标时怎么排查

一、检查kube-controller-manager的Service Monitor是否成功创建,观察到已成功创建 二、检查kube-controller-manager的Service Monitor标签是否配置正确,观察到已配置 使用kube-controller-ma...
头像3年前
0335
Rancher安装Prometheus监控-AI运维探索者

Rancher安装Prometheus监控

一、Rancher安装Prometheus监控 1、点击【应用】-【chart】,类别选择Rancher,筛选内容为monitoring 2、选择Monitoring (103.0.4+up45.31.1)版本,点击【安装】 3、选择【安装到项目System】,勾...
头像1年前
0317
Blackbox Exporter监控域名实战-AI运维探索者

Blackbox Exporter监控域名实战

一、创建一个空文件,然后通过该文件创建一个 Secret,那么这个 Secret 即可作为 Prometheus 的静态配置 查看 Secret是否创建完成 二、创建完 Secret 后,需要编辑下 Prometheus 配置 三、参考[...
头像3年前
0317
Filebeat与Loki日志收集方案分析-AI运维探索者

Filebeat与Loki日志收集方案分析

一、Filebeat 在早期的ELK架构中,日志收集均以Logstash为主,Logstash负责收集和解析日志,它对内存、CPU、IO资源的消耗比较高,但是Filebeat所占系统的CPU和内存几乎可以忽略不计。 由于Fileb...
头像3年前
03111