排序
GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘
一、为什么还需要 `dcgm-exporter` `node_exporter` 能看到系统级指标,但看不到足够细的 GPU 运行细节。而大模型推理和训练最关心的常常是: * GPU 利用率; * 显存占用; * 温度和功耗; * 显...
Loki安装、查询语法与环境清理
一、前言 本文主要以下几方面介绍Loki: * Loki安装 * Loki语法 * Loki清理 二、Loki安装 提前下载好安装文件 1.创建独立命名空间 2.添加并更新 Loki 的 Helm 仓库 3.创建 Loki Stack 上面配置参...
Dify+Grafana运维实践:Grafana、Loki 与 Promtail 搭建
一、安装 Grafana 官网下载地址: https://grafana.com/grafana/download 由于官网下载很慢,所以可以配置一个阿里云的源 vi /etc/yum.repos.d/grafana.repo 内容如下 用dnf安装grafana 启动服...
Grafana 监控大盘实战:部署、数据源与企业看板
一、Grafana简述 Grafana 是一个开源的度量分析与可视化工具。提供查询、可视化、报警和指标展示等 功能,能灵活创建图表、仪表盘等可视化界面。 **主要功能:** - **可视化**: 提供多种可选择...





