可观测性 第3页
Prometheus:Kubernetes 常用资源对象监控-AI运维探索者

Prometheus:Kubernetes 常用资源对象监控

一、容器监控 先把Configmap导出为yaml文件: 编辑yaml,在scrape_configs: 下面增加如下内容 应用配置 重启Prometheus服务 打开浏览器输入http://192.168.1.31:31093访问Prometheus,到Promethe...
头像3年前
02610
Prometheus 黑盒监控:Ingress 服务探测-AI运维探索者

Prometheus 黑盒监控:Ingress 服务探测

一、Ingress服务的探测(视频中未讲到,扩展+) 则需要在ingress上添加注释必须有以下三行 示例:Java应用的ing:
头像3年前
04910
Prometheus:利用consul监控Nginx-AI运维探索者

Prometheus:利用consul监控Nginx

一、新起一个nginx pod。 查看 二、到pod里面安装vim,去配置一下status页 三、在Pod里面编辑配置文件 在最后面的 } 上面添加如下内容(可以使用shift+insert进行粘贴) 在Pod里面重新加载 四、在P...
头像3年前
04310
Prometheus 自定义监控:接入云主机 Node Exporter-AI运维探索者

Prometheus 自定义监控:接入云主机 Node Exporter

一、虚机数据抓取 1.1 配置安装node-exporter 验证数据收集: 1.2 配置prometheus-config.yaml 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `other-ECS` ...
头像3年前
03410
Prometheus 黑盒监控:TCP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:TCP 探测配置实战

一、TCP检测 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `service-tcp-probe` 任务 则需要在service上添加注释必须有以下三行 示例:Java应用的svc:
头像3年前
03410
Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS-AI运维探索者

Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS

一、scheduler >由上可知,匹配pod对象,lable标签为component=kube-scheduler即可scheduler和controller-manager一样,默认监听0端口,需要注释 所有Master节点修改 `/etc/kubernetes/manif...
头像3年前
0539
使用 Zabbix 监控 Nginx 服务与 80 端口状态-AI运维探索者

使用 Zabbix 监控 Nginx 服务与 80 端口状态

一、自定义nginx模板 1.1 客户端安装nginx 1、进入nginx官网,复制官方yum源 Nginx官网链接: <img src="https://bucketbucket1.oss-cn-beijing.aliyuncs.com/imag/d5df0ed2a9d0_
头像3年前
0509
Prometheus监控MySQL实战:Exporter与ServiceMonitor配置-AI运维探索者

Prometheus监控MySQL实战:Exporter与ServiceMonitor配置

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
头像3年前
0288
Dify+Grafana MCP:日志与监控大盘智能体-AI运维探索者

Dify+Grafana MCP:日志与监控大盘智能体

一、部署mcpgrafana 建议部署到grafana那台主机 1.1 安装docker 如果系统里没有docker环境,还需要安装一下docker,系统版本Rocky9 安装dnf插件工具 配置阿里云的docker源 安装dockerce 配置doc...
头像2个月前
0508
大模型运维监控入门:命令行工具、Prometheus 与 Grafana-AI运维探索者

大模型运维监控入门:命令行工具、Prometheus 与 Grafana

一、先用命令行工具做最小监控 1.1 NVIDIA GPU:`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具,前提是已经安装好显卡驱动。 常见用法: 它最适合做: * 快速排查显存占用; * 看当前...
头像7个月前
0488