可观测性共51篇
Rancher安装Prometheus监控-AI运维探索者

Rancher安装Prometheus监控

一、Rancher安装Prometheus监控 1、点击【应用】-【chart】,类别选择Rancher,筛选内容为monitoring 2、选择Monitoring (103.0.4+up45.31.1)版本,点击【安装】 3、选择【安装到项目System】,勾...
头像1年前
0317
Istio可观测实践-AI运维探索者

Istio可观测实践

一、环境准备 1、下载环境资源yaml 2、部署Prometheus、Grafana、kiali、Jaeger 检测 3、设置Kiali登录的用户名和密码 说明:用户名和密码都是admin 4、配置各组件对外访问 (1)kiali对外端口为1...
头像4年前
04811
Dify+Grafana MCP:日志与监控大盘智能体-AI运维探索者

Dify+Grafana MCP:日志与监控大盘智能体

一、部署mcpgrafana 建议部署到grafana那台主机 1.1 安装docker 如果系统里没有docker环境,还需要安装一下docker,系统版本Rocky9 安装dnf插件工具 配置阿里云的docker源 安装dockerce 配置doc...
头像2个月前
0508
大模型运维监控入门:命令行工具、Prometheus 与 Grafana-AI运维探索者

大模型运维监控入门:命令行工具、Prometheus 与 Grafana

一、先用命令行工具做最小监控 1.1 NVIDIA GPU:`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具,前提是已经安装好显卡驱动。 常见用法: 它最适合做: * 快速排查显存占用; * 看当前...
头像7个月前
0488
生产级日志平台架构:亿级流量场景与云原生日志采集方案-AI运维探索者

生产级日志平台架构:亿级流量场景与云原生日志采集方案

一、生产级亿级流量日志平台架构解析 1.1 生产级亿级流量日志平台架构图 1.1 架构核心组件及流程 1、日志生成层(Kubernetes + e-service) * **Kubernetes** 作为容器编排平台,管理业务微服务...
头像3年前
0466
日志平台设计:如何搭建有价值的日志分析体系-AI运维探索者

日志平台设计:如何搭建有价值的日志分析体系

一、日志规范 在K8S架构中,为了统一和标准化日志格式,可以使用以下几种常见的日志规范: 1、日志格式规范: - 结构化日志:使用结构化日志格式,如JSON、XML 或 Key-Value Pair(键值 对)格...
头像3年前
05112
多种日志收集方案:应用日志、Pod 日志与 Sidecar 实践-AI运维探索者

多种日志收集方案:应用日志、Pod 日志与 Sidecar 实践

一、前言 集群级/应用日志通过将日志数据从容器或节点中解耦,并将其发送到集中的日志存储或处理系统,使日志数据在整个集群中可见。 **优势**:即使容器或节点发生故障,仍然可以访问日志数据...
头像3年前
0277
LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案-AI运维探索者

LPG 部署实战:Loki + Promtail + Grafana 轻量日志方案

一、EFK vs LPG **架构和组件:** - Loki:Loki 是一个开源的水平可扩展日志聚合系统,由 Promtail、Loki 和 Grafana 组成。 - EFK:EFK 是一个集成的解决方案,由 Elasticsearch、Fluentd 和 K...
头像3年前
0346
Kubernetes日志收集基础:日志类型、技术栈与工具对比-AI运维探索者

Kubernetes日志收集基础:日志类型、技术栈与工具对比

一、有哪些日志需要收集管理? 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 * /var/log/messages * /var/log/kube-xxx.log * Kubernetes组件日志(/var/log/kube.*)...
头像3年前
05114
Kubernetes日志收集内容与技术栈概览-AI运维探索者

Kubernetes日志收集内容与技术栈概览

一、前言 本文主要以下几方面介绍k8s日志收集: * 日志收集内容 * 日志收集工具 * 日志收集架构分析 二、日志收集内容 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 ...
头像3年前
04114