可观测性 第4页
Prometheus 黑盒监控:ICMP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:ICMP 探测配置实战

一、ICMP监控 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-http-services` 任务
头像3年前
0637
大模型运维监控入门:命令行工具、Prometheus 与 Grafana-AI运维探索者

大模型运维监控入门:命令行工具、Prometheus 与 Grafana

一、先用命令行工具做最小监控 1.1 NVIDIA GPU:`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具,前提是已经安装好显卡驱动。 常见用法: 它最适合做: * 快速排查显存占用; * 看当前...
头像8个月前
0518
Prometheus:使用PromQL查询监控指标-AI运维探索者

Prometheus:使用PromQL查询监控指标

一、什么是PromQL PromQL(Prometheus Query Language)是Prometheus内置的数据查询语言,其提供对时间序列数据丰富的查询,聚合以及逻辑运算能力的支持。并且被广泛应用在Prometheus的日常应用当...
头像3年前
0536
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
头像3年前
04814
Filebeat与Loki日志收集方案分析-AI运维探索者

Filebeat与Loki日志收集方案分析

一、Filebeat 在早期的ELK架构中,日志收集均以Logstash为主,Logstash负责收集和解析日志,它对内存、CPU、IO资源的消耗比较高,但是Filebeat所占系统的CPU和内存几乎可以忽略不计。 由于Fileb...
头像3年前
03511
Prometheus 黑盒监控:Ingress 服务探测-AI运维探索者

Prometheus 黑盒监控:Ingress 服务探测

一、Ingress服务的探测(视频中未讲到,扩展+) 则需要在ingress上添加注释必须有以下三行 示例:Java应用的ing:
头像3年前
05110
Istio可观测实践-AI运维探索者

Istio可观测实践

一、环境准备 1、下载环境资源yaml 2、部署Prometheus、Grafana、kiali、Jaeger 检测 3、设置Kiali登录的用户名和密码 说明:用户名和密码都是admin 4、配置各组件对外访问 (1)kiali对外端口为1...
头像4年前
05211
Prometheus:利用consul监控Nginx-AI运维探索者

Prometheus:利用consul监控Nginx

一、新起一个nginx pod。 查看 二、到pod里面安装vim,去配置一下status页 三、在Pod里面编辑配置文件 在最后面的 } 上面添加如下内容(可以使用shift+insert进行粘贴) 在Pod里面重新加载 四、在P...
头像3年前
04510
Prometheus 自定义监控:接入 MySQL 指标-AI运维探索者

Prometheus 自定义监控:接入 MySQL 指标

一、自定义中间件监控 1.1 创建mysql监听用户并授权,注意服务ip不要填错 1.2 启动容器 1.2 启动监控容器 创建配置文件 启动容器并挂载配置 验证容器 1.2 可能遇到的问题 执行下面命令启动容器 ...
头像3年前
0527
Kubernetes日志收集内容与技术栈概览-AI运维探索者

Kubernetes日志收集内容与技术栈概览

一、前言 本文主要以下几方面介绍k8s日志收集: * 日志收集内容 * 日志收集工具 * 日志收集架构分析 二、日志收集内容 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 ...
头像3年前
04414