Prometheus 第2页
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
头像3年前
04614
PromQL入门:基础语法与时间范围查询-AI运维探索者

PromQL入门:基础语法与时间范围查询

一、PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。 Prometheus ...
头像3年前
03614
Prometheus:AlertManager配置钉钉告警-AI运维探索者

Prometheus:AlertManager配置钉钉告警

一、准备工作。 1.1 创建钉钉机器人(只能在内部群里添加) 点击【群设置】-【机器人】-【添加机器人】 选择【自定义】-【添加】 定义机器人名字,选择【加签】-【完成】。需要复制加签字符串SEC7...
头像3年前
03814
Prometheus:kube-state-metrics和metrics-server-AI运维探索者

Prometheus:kube-state-metrics和metrics-server

一、kube-state-metrics 1、介绍 Kube-state-metrics 是一个Kubernetes组件,它提供了一种将 Kubernetes 集群中各资源状态信息转化为可监控指标的方法,以帮助用户更好地理解和监控集群的健康状...
头像3年前
04514
Prometheus静态配置监控Windows主机实战-AI运维探索者

Prometheus静态配置监控Windows主机实战

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
头像3年前
04314
Prometheus入门:核心概念、应用场景与特性-AI运维探索者

Prometheus入门:核心概念、应用场景与特性

一、什么是Prometheus Prometheus是一个开源的系统监控和警报工具,用于收集和存储应用程序和系统的时间序列数据。它由SoundCloud开发并于2012年首次发布,后来成为Cloud Native Computing Foun...
头像3年前
03913
ServiceMonitor入门:定义、价值与工作机制-AI运维探索者

ServiceMonitor入门:定义、价值与工作机制

一、ServiceMonitor是什么 ServiceMonitor 是 Prometheus Operator 提供的一种 Kubernetes 自定义资源(Custom Resource),用于告诉 Prometheus 如何监控服务(Service)。它是 Prometheus Ope...
头像3年前
05113
Prometheus 部署实战:在 Kubernetes 中搭建监控平台-AI运维探索者

Prometheus 部署实战:在 Kubernetes 中搭建监控平台

一、部署配置 整个监控体系涉及的技术栈较多,几乎可覆盖真实企业中的所有场景。主要技术栈如下: - Prometheus:监控主服务 - node-exporter:数据采集器 - kube-state-metrics:数据采集器 - ...
头像3年前
04313
Prometheus:使用Grafana实现监控指标可视化-AI运维探索者

Prometheus:使用Grafana实现监控指标可视化

一、安装grafana-10.1.4版本 前期准备工作:安装helm和SC 1、下载包 2、修改values.yaml (1)定义storageClass: 'nfs-client' (2)执行`/image:`搜索镜像,替换国外镜像为国内镜像 替换docker.io/...
头像3年前
04013
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
头像3年前
04313