监控告警 第4页
读懂ServiceMonitor YAML:关键字段与配置示例-AI运维探索者

读懂ServiceMonitor YAML:关键字段与配置示例

一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
头像3年前
03712
黑盒监控和白盒监控有什么区别-AI运维探索者

黑盒监控和白盒监控有什么区别

一、什么是黑盒监控 黑盒监控是从外部视角对系统进行监控,类似于使用用户的角度观察系统。监控系统并不了解系统的内部工作方式,只关注对外部暴露的接口和功能的响应情况。黑盒监控主要通过发...
头像3年前
02612
PrometheusAlert 入门:为什么需要告警消息转发平台-AI运维探索者

PrometheusAlert 入门:为什么需要告警消息转发平台

一、为什么要用PrometheusAlert? - 1.1 背景 - 通过configmap配置文件维护告警媒介辨析度低; - 部分快消息告警媒介需要额外部署webhook做转发; - alertmanager web UI 较简单,不足以展示更...
头像3年前
02512
Prometheus 自动伸缩:Metrics Server 与 HPA 实战-AI运维探索者

Prometheus 自动伸缩:Metrics Server 与 HPA 实战

一、背景 - Kubernetes集群规模大、动态变化快,而且容器化应用部署和服务治理机制的普 及,传统的基础设施监控方式已经无法满足Kubernetes集群的监控需求。 - 需要使用专门针对Kubernetes集群...
头像3年前
03412
Prometheus+Alertmanager实战:MySQL连接失败告警-AI运维探索者

Prometheus+Alertmanager实战:MySQL连接失败告警

一、监控数据库 在实现告警之前,我们需要先实现监控。下面通过Exporter实现对数据库的监控: 具体如何实现对数据库的监控,可参考:[Prometheus实战---监控非云原生应用Mysql](https://zhuanla...
头像3年前
03111
Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API-AI运维探索者

Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API

一、使用Prometheus监控Jenkins 1.1 安装使用插件 - https://plugins.jenkins.io/prometheus/ Default namespace: **monitoring** **Prometheus安装的Namespace** **检查 Jenkins 暴露的 promth...
头像4年前
04111
Alertmanager 高级配置:接入钉钉告警与静默管理-AI运维探索者

Alertmanager 高级配置:接入钉钉告警与静默管理

一、基于钉钉的报警媒介 [自定义机器人安全设置 - 钉钉开放平台 (dingtalk.com)](https://open.dingtalk.com/document/robots/customize-robot-security-settings) [创建自定义机器人 - 钉钉开...
头像3年前
03311
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
头像3年前
03611
Prometheus 黑盒监控:Ingress 服务探测-AI运维探索者

Prometheus 黑盒监控:Ingress 服务探测

一、Ingress服务的探测(视频中未讲到,扩展+) 则需要在ingress上添加注释必须有以下三行 示例:Java应用的ing:
头像3年前
04910
Prometheus介绍和安装-AI运维探索者

Prometheus介绍和安装

一、Prometheus介绍 **Prometheus定义** Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维...
头像3年前
05210