监控告警 第4页
Prometheus 自动伸缩:Metrics Server 与 HPA 实战-AI运维探索者

Prometheus 自动伸缩:Metrics Server 与 HPA 实战

一、背景 - Kubernetes集群规模大、动态变化快,而且容器化应用部署和服务治理机制的普 及,传统的基础设施监控方式已经无法满足Kubernetes集群的监控需求。 - 需要使用专门针对Kubernetes集群...
头像3年前
03712
Prometheus 黑盒监控:K8S 内部 HTTP 探测-AI运维探索者

Prometheus 黑盒监控:K8S 内部 HTTP 探测

一、HTTP 监控(K8S 内部发现方法) 1.1 自定义发现 `Service` 监控 `端口` 和 `路径` 可以如下设置: 然后,需要在 `Service` 中配置这样的 `annotation` : 示例:Java应用的svc: 按上面方法...
头像3年前
02512
Prometheus Operator 部署实战:CRD、Kube-Prometheus 与访问验证-AI运维探索者

Prometheus Operator 部署实战:CRD、Kube-Prometheus 与访问验证

一、Prometheus Operator & Kube-Prometheus & Helm chart 部署区别 Prometheus Operator 是 Kubernetes 原生的工具,它通过将 Prometheus 资源定 义为 Kubernetes 对象(CRD)来简化 P...
头像3年前
05212
读懂ServiceMonitor YAML:关键字段与配置示例-AI运维探索者

读懂ServiceMonitor YAML:关键字段与配置示例

一、能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。 下面以ES模板...
头像3年前
04212
Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API-AI运维探索者

Jenkins 监控与 API 调用:Prometheus、InfluxDB、Grafana 与 REST API

一、使用Prometheus监控Jenkins 1.1 安装使用插件 - https://plugins.jenkins.io/prometheus/ Default namespace: **monitoring** **Prometheus安装的Namespace** **检查 Jenkins 暴露的 promth...
头像4年前
04411
Alertmanager 高级配置:接入钉钉告警与静默管理-AI运维探索者

Alertmanager 高级配置:接入钉钉告警与静默管理

一、基于钉钉的报警媒介 [自定义机器人安全设置 - 钉钉开放平台 (dingtalk.com)](https://open.dingtalk.com/document/robots/customize-robot-security-settings) [创建自定义机器人 - 钉钉开...
头像3年前
03711
Prometheus 黑盒监控:DNS 探测配置实战-AI运维探索者

Prometheus 黑盒监控:DNS 探测配置实战

一、DNS 监控 参数解释: 更新 `prometheus-config.yaml`配置 : 打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-service-dns` 任务; graph 页面,可以使用 `probe_succes...
头像3年前
03911
Prometheus+Alertmanager实战:MySQL连接失败告警-AI运维探索者

Prometheus+Alertmanager实战:MySQL连接失败告警

一、监控数据库 在实现告警之前,我们需要先实现监控。下面通过Exporter实现对数据库的监控: 具体如何实现对数据库的监控,可参考:[Prometheus实战---监控非云原生应用Mysql](https://zhuanla...
头像3年前
03611
Prometheus监控Kubernetes集群-AI运维探索者

Prometheus监控Kubernetes集群

一、监控集群节点 先把Configmap导出为yaml文件: 编辑yaml,在scrape_configs: 下面增加如下内容 应用配置 重启Prometheus服务 打开浏览器输入http://192.168.1.31:31093访问Prometheus,到Prom...
头像3年前
04610
Prometheus:利用consul监控Nginx-AI运维探索者

Prometheus:利用consul监控Nginx

一、新起一个nginx pod。 查看 二、到pod里面安装vim,去配置一下status页 三、在Pod里面编辑配置文件 在最后面的 } 上面添加如下内容(可以使用shift+insert进行粘贴) 在Pod里面重新加载 四、在P...
头像3年前
04510