排序
Kubernetes集群优化
一、节点、pod、容器数量 官方标准如下: - 不超过 5000 个节点 - 不超过 150000 个 pod - 不超过 300000 个容器 - 每个节点不超过 100 个 pod 二、Master节点配置优化 Master节点上CPU和内存推...
Kubernetes集群为什么必须做资源分配与限制
一、为什么需要进行资源分配和限制? 生产中可能存在如下几个核心问题: * 1)服务部署过量分配资源导致资源浪费 * 2)资源设置过大的limit导致机器故障 * 3)服务下线未及时清理导致过多垃圾数...
Kubernetes里的DNS
一、DNS服务 1、K8s集群内有一个DNS服务: 2、K8s集群内有对应的Pod为coredns: 3、查看defalut命名空间Pod里的/etc/resolv.conf 4、查看aming命名空间Pod里的/etc/resolv.conf 上面参数说明: ...
Kubernetes跨机房调度实战:让同一应用分布在不同机房
一、同一应用分布在不同机房 1.1 同一应用尽量分布在不同机房 1、给机房添加不同的标签 验证,观察到目前分为两个域,第一个域beijing-haidian分布的节点为k8s-master01和k8s-node02,第二个域b...
Kubernetes落地的真实挑战:复杂性、可观测性与团队协作成本
一、Kubernetes 自身复杂性是第一道门槛 Kubernetes 的学习成本很高,原因主要来自两个方面。 首先是概念多。Pod、Deployment、Service、Ingress、ConfigMap、Secret、StatefulSet、DaemonSet、...
Kubernetes节点维护实战:taint 与 cordon或drain 两种下线流程对比
一、K8s节点维护流程 当 Kubernetes 的节点需要进行下线维护时,此时需要先把该节点的服务进行驱逐和重新调度。 此时需要根据实际情况判断是直接驱逐还是选择重新调度,比如某个 Pod 只有一个副...
Kubernetes节点维护不中断实战:taint、drain 与 PDB 组合使用
一、问题三:节点维护如何不影响服务? 在 Kubernetes 集群中,节点维护(如版本升级、系统升级、漏洞修复)时,可通过以下策略确保服务不受影响: 1、标记节点为不可调度 * **添加污点(Taint)...
Kubernetes节点标签与nodeSelector实战
一、Node标签概念 每个node节点默认会有很多标签,标签在日常工作中就类似我们的一个标识;看到标签 就能晓得这台node节点的主要用处; 1.1 为节点添加标签 查看节点 为node节点加上核心应用的...
Kubernetes节点故障后如何快速恢复服务:污点、驱逐与重新调度
一、问题一:节点故障如何快速恢复服务? 在 Kubernetes 集群中,当某个节点发生故障时,通过以下机制快速恢复服务: 1、节点故障检测 - **节点控制器(Node Controller)** 定期检查节点状态(...
Kubernetes节点宕机后如何加速Pod漂移恢复
一、节点宕机快速恢复服务 > 说明:当节点故障时,k8s集群中默认需要等待5分钟,才能进行漂移。 1.1 环境准备 1、清除node02节点上的污点 2、创建测试应用 应用 1.2 节点宕机快速恢复服务 1...











