张卿
2025-01-18
502
11
0
在多团队或多租户共用集群的场景下,最常见的治理诉求就是给不同使用方分配不同的资源额度。本文通过租户与团队配额案例,演示如何把 ResourceQuota 真正落到生产管理中。
张卿
2025-01-17
577
13
0
理解了 ResourceQuota 的作用之后,下一步就是掌握它的配置结构和基本使用方式。本文围绕常见字段、配置语法,以及限制 ConfigMap 和 Pod 数量的基础示例展开说明。
张卿
2025-01-16
711
19
0
ResourceQuota 是 Kubernetes 命名空间级资源治理的核心对象,用来限制资源总量和对象数量。本文先把它的定义、出现背景和典型使用场景讲清楚。
张卿
2025-01-15
741
12
0
资源治理不只是设置一个上限,更关键的是先把资源边界划分清楚。本文围绕租户、环境和 Namespace 三种常见维度,说明 Kubernetes 集群应该如何做资源池划分。
张卿
2025-01-14
834
13
0
Kubernetes 集群资源并不是无限的,如果缺少明确的分配与限制机制,资源浪费、节点故障和多租户抢占会很快出现。本文从几个典型问题出发,梳理为什么集群必须做资源合理化分配。
张卿
2025-01-13
936
29
0
除了主节点、GPU 节点和 Ingress 节点,很多集群还会为特定团队、特定硬件或特殊业务划定专用节点。本文整理 dedicated、special 与 NoExecute 驱逐的典型用法,帮助你建立更完整的隔离策略。
张卿
2025-01-12
994
30
0
默认情况下,节点宕机后的业务恢复并不算快,因为系统会等待一段时间再执行驱逐和重新调度。本文结合 tolerationSeconds 的配置,说明如何缩短故障恢复时间。
张卿
2025-01-11
709
28
0
Ingress 控制器往往需要独立节点承载,避免与其他业务混跑。本文通过 Ingress 专用节点案例,串联 taint、toleration 和 nodeSelector 三类常见调度手段。
张卿
2025-01-10
764
20
0
特殊硬件节点的价值在于服务特定业务,而不是变成普通工作负载的公共资源池。本文把节点资源保留和 GPU 容忍调度放在一起,演示如何为特殊资源设计更合理的调度边界。
张卿
2025-01-09
932
14
0
节点下线既可以用 taint 手工控制迁移节奏,也可以直接借助 cordon 和 drain 完成标准化操作。本文通过一个真实维护流程,对比两种方式的适用场景与执行步骤。