最新发布第112页
Nginx代理入门:正向代理、反向代理与proxy_pass快速上手-AI运维探索者

Nginx代理入门:正向代理、反向代理与proxy_pass快速上手

一、代理到底是什么 这里先把“代理”讲得很生活化: 代理就像外卖平台、中介或代办服务,用户不直接和目标打交道,而是先经过中间人。 在 Web 场景里,这个“中间人”通常就是代理服务器。 如...
GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘-AI运维探索者

GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘

一、为什么还需要 `dcgm-exporter` `node_exporter` 能看到系统级指标,但看不到足够细的 GPU 运行细节。而大模型推理和训练最关心的常常是: * GPU 利用率; * 显存占用; * 温度和功耗; * 显...
LimitRange是什么、出现背景与配置解析-AI运维探索者

LimitRange是什么、出现背景与配置解析

一、LimitRange是什么 默认情况下, Kubernetes 集群上的容器运行使用的计算资源没有限制。 使用 Kubernetes 资源配额, 管理员(也称为 **集群操作者**)可以在一个指定的命名空间内限制集群资...
Helm模板基础:内置对象与常用函数-AI运维探索者

Helm模板基础:内置对象与常用函数

一、基础语法实验准备 在演示下面内容之前自定义一个Chart示例 二、Helm 内置对象 下面是常用的内置对象: | **内置** | **作用** | | ----------------- | --------------------------------- ...
Ansible流程控制实战:handlers重载服务、when按系统判断与loop批量操作-AI运维探索者

Ansible流程控制实战:handlers重载服务、when按系统判断与loop批量操作

一、案例一:handlers 触发器怎么用 先看一个“分发配置文件后重启 NFS 服务”的场景。 1.1 不使用 handlers 的问题 如果剧本直接写成下面这样: 那么不管 `/etc/exports` 是否真的发生变化,NF...
Ceph RBD StorageClass 实战:默认存储卷与 PVC 验证-AI运维探索者

Ceph RBD StorageClass 实战:默认存储卷与 PVC 验证

一、部署RBD StorageClass Ceph 可以同时提供对象存储 RADOSGW、块存储 RBD、文件系统存储 Ceph FS。 RBD 即 RADOS Block Device 的简称,RBD 块存储是最稳定且最常用的存储类型。 RBD 块设备类...
Kubernetes快速入门:基于kubeadm搭建三节点K8s集群-AI运维探索者

Kubernetes快速入门:基于kubeadm搭建三节点K8s集群

一、先明确实验环境和搭建目标 本文示例使用 1 个控制平面节点和 2 个工作节点,目的是完成一个可正常调度 Pod、可查看系统组件状态、可通过可视化界面访问的基础 Kubernetes 集群。 1.1 节点规...
Zabbix 配置详解与自定义监控实践-AI运维探索者

Zabbix 配置详解与自定义监控实践

一、zbx配置详解 1.1 服务端配置 文件目录 <tbody
Sentinel 实战:规则体系、持久化与流量治理案例-AI运维探索者

Sentinel 实战:规则体系、持久化与流量治理案例

一、资源与规则 1.1 资源与规则说明 使用 Sentinel 来进行资源保护,主要分为几个步骤: 1. 定义资源 2. 定义规则 3. 检验规则是否生效 先把可能需要保护的资源定义好,之后再配置规则。也可以理...
RBAC对集群资源的权限控制与对象配置解析-AI运维探索者

RBAC对集群资源的权限控制与对象配置解析

一、对集群资源的权限控制 在 Kubernetes API 中,大多数资源都是使用对象名称的字符串表示来呈现与访问的。 例如,对于 Pod 应使用 'pods'。 RBAC 使用对应 API 端点的 URL 中呈现的名字来引用...