指标监控 第6页
Prometheus:更新consul配置到Prometheus-AI运维探索者

Prometheus:更新consul配置到Prometheus

一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加,如下。 **说明:因为consul-ui服务地址如果重启会发生变化,所以这里选择服务名** 二、重新导入配置 三、重启Prometheus服务 四...
头像3年前
0425
Kube-State-Metrics 入门:K8S 集群层监控的基础组件-AI运维探索者

Kube-State-Metrics 入门:K8S 集群层监控的基础组件

一、KubeStateMetrics简介 kube-state-metrics 是一个 Kubernetes 组件,它通过查询 Kubernetes 的 API 服务 器,收集关于 Kubernetes 中各种资源(如节点、pod、服务等)的状态信息,并将这些...
头像3年前
03813
PrometheusRule入门:概念、结构与关键字段解析-AI运维探索者

PrometheusRule入门:概念、结构与关键字段解析

一、PrometheusRule是什么 `PrometheusRule` 是 Prometheus Operator 中的一个自定义资源(Custom Resource),它用于定义 Prometheus 在监控系统中的规则和警报规则。 Prometheus 是一种开源的...
头像3年前
0438
Prometheus 自动伸缩:Metrics Server 与 HPA 实战-AI运维探索者

Prometheus 自动伸缩:Metrics Server 与 HPA 实战

一、背景 - Kubernetes集群规模大、动态变化快,而且容器化应用部署和服务治理机制的普 及,传统的基础设施监控方式已经无法满足Kubernetes集群的监控需求。 - 需要使用专门针对Kubernetes集群...
头像3年前
03712
Prometheus:AlertManager介绍和安装-AI运维探索者

Prometheus:AlertManager介绍和安装

一、查看service 二、打开浏览器,输入http://192.168.1.31:32590访问即可
头像3年前
0509
Alertmanager入门:核心概念与主要功能-AI运维探索者

Alertmanager入门:核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后,Alertmanager 管理这些警报,包括沉默、抑制、聚合以及通过电子邮件、待命...
头像3年前
0265
Prometheus 黑盒监控:ICMP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:ICMP 探测配置实战

一、ICMP监控 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-http-services` 任务
头像3年前
0637
Prometheus:配置Prometheus告警规则-AI运维探索者

Prometheus:配置Prometheus告警规则

一、添加Prometheus告警规则 找到rules.yaml,将 rules.yaml: '{}' 改为以下内容 上面参数说明: * `groups` 是一个规则组的列表,每个规则组包含一组相关的告警规则。 * `name: hostStatsAlert...
头像3年前
02410
Kubernetes中高可用安装Prometheus实战-AI运维探索者

Kubernetes中高可用安装Prometheus实战

一、安装方式介绍 Prometheus 可以以多种方式进行安装和部署,适应不同的需求和环境。以下是一些常见的 Prometheus 安装方式(更多信息请参考[Prometheus官网](https://prometheus.io/docs/prome...
头像3年前
05115
PrometheusRule怎么写:从Grafana面板到MySQL告警规则-AI运维探索者

PrometheusRule怎么写:从Grafana面板到MySQL告警规则

一、打开Mysql的Dashboard,点击【Edit】 二、复制相关PromQL语句 在此基础做相应修改 三、在Prometheus上测试即可 四、告警规则所需要的expr已经完成,接下来创建PrometheusRule即可 上面参数说...
头像3年前
0339