张卿
2025-01-08
786
15
0
控制哪些节点暂时不能承载业务,是生产环境中非常常见的调度诉求。本文分别以主节点隔离和新节点验收为例,说明如何通过 Taint 阻止 Pod 被调度到不合适的节点。
张卿
2025-01-07
571
25
0
Toleration 并不会主动决定 Pod 一定调度到哪里,但它决定了 Pod 是否有资格进入带污点的节点。本文用最常见的配置样式和一个完整示例,把 Toleration 的工作方式讲清楚。
张卿
2025-01-06
971
16
0
理解污点概念之后,更关键的是把它真正用起来。本文围绕 Taint 的配置格式、Effect 语义,以及增删改查四类常见命令,整理一套可直接上手的实操笔记。
张卿
2025-01-05
707
12
0
Taint 是 Kubernetes 做节点侧准入控制的核心能力,它决定了哪些 Pod 可以被节点接纳。本文从概念、出现背景、典型使用场景和系统内置污点四个方面,建立对 Taint 的整体认知。
张卿
2025-01-04
807
16
0
新节点并不是加入集群后就应该立即承接业务,多租户场景下更需要精细化隔离策略。本文结合新节点验收和租户隔离两个问题,说明如何在可用性与安全性之间取得平衡。
张卿
2025-01-03
942
17
0
节点维护并不意味着业务必须停机,只要调度策略设计得当,就可以在升级、打补丁和迁移时把影响降到最低。本文系统整理节点维护期间常用的 taint、drain、多副本和 PDB 方案。
张卿
2025-01-02
857
21
0
当集群里存在 GPU、SSD 或高性能节点时,如果不加限制,普通业务很容易占用这些稀缺资源。本文从污点、容忍和亲和性配合使用的角度,解释如何把特殊资源留给真正需要的工作负载。
张卿
2025-01-01
634
23
0
节点故障是 Kubernetes 集群里最常见也最危险的风险之一。本文围绕节点失联后的污点标记、Pod 驱逐和重新调度机制,梳理服务快速恢复的完整链路。
张卿
2024-10-26
2
0
0
本文继续从 APISIX 的实际使用出发,整理 Dashboard、API 路由与上游管理,以及与 Nacos 集成实现服务发现的案例实践。
张卿
2024-10-25
3
0
0
本文围绕 Apache APISIX 的基本能力展开,介绍其架构、应用场景、安装方式与配置管理,适合作为 API 网关学习的入门文章。