Kubernetes-AI运维探索者-第14页

Kubernetes集群优化

一、节点、pod、容器数量官方标准如下： - 不超过 5000 个节点 - 不超过 150000 个 pod - 不超过 300000 个容器 - 每个节点不超过 100 个 pod 二、Master节点配置优化 Master节点上CPU和内存推...

# Kubernetes # 云原生 # 容器编排

2年前

0345

Kubernetes集群为什么必须做资源分配与限制

一、为什么需要进行资源分配和限制? 生产中可能存在如下几个核心问题： * 1）服务部署过量分配资源导致资源浪费 * 2）资源设置过大的limit导致机器故障 * 3）服务下线未及时清理导致过多垃圾数...

# Kubernetes # 云原生 # 容器编排

2年前

0479

Kubernetes里的DNS

一、DNS服务 1、K8s集群内有一个DNS服务： 2、K8s集群内有对应的Pod为coredns： 3、查看defalut命名空间Pod里的/etc/resolv.conf 4、查看aming命名空间Pod里的/etc/resolv.conf 上面参数说明： ...

# Kubernetes # 云原生 # 容器编排

2年前

02914

Kubernetes跨机房调度实战：让同一应用分布在不同机房

一、同一应用分布在不同机房 1.1 同一应用尽量分布在不同机房 1、给机房添加不同的标签验证，观察到目前分为两个域，第一个域beijing-haidian分布的节点为k8s-master01和k8s-node02，第二个域b...

# Kubernetes # 云原生 # 容器编排

2年前

04811

Kubernetes落地的真实挑战：复杂性、可观测性与团队协作成本

一、Kubernetes 自身复杂性是第一道门槛 Kubernetes 的学习成本很高，原因主要来自两个方面。首先是概念多。Pod、Deployment、Service、Ingress、ConfigMap、Secret、StatefulSet、DaemonSet、...

# Kubernetes # 云原生 # 容器编排

2年前

03310

Kubernetes节点维护实战：taint 与 cordon或drain 两种下线流程对比

一、K8s节点维护流程当 Kubernetes 的节点需要进行下线维护时，此时需要先把该节点的服务进行驱逐和重新调度。此时需要根据实际情况判断是直接驱逐还是选择重新调度，比如某个 Pod 只有一个副...

# Kubernetes # 云原生 # 容器编排

2年前

02810

Kubernetes节点维护不中断实战：taint、drain 与 PDB 组合使用

一、问题三：节点维护如何不影响服务? 在 Kubernetes 集群中，节点维护（如版本升级、系统升级、漏洞修复）时，可通过以下策略确保服务不受影响： 1、标记节点为不可调度 * **添加污点（Taint）...

# Kubernetes # 云原生 # 容器编排

2年前

02815

Kubernetes节点标签与nodeSelector实战

一、Node标签概念每个node节点默认会有很多标签，标签在日常工作中就类似我们的一个标识；看到标签就能晓得这台node节点的主要用处； 1.1 为节点添加标签查看节点为node节点加上核心应用的...

# Kubernetes # 云原生 # 容器编排

2年前

04313

Kubernetes节点故障后如何快速恢复服务：污点、驱逐与重新调度

一、问题一：节点故障如何快速恢复服务? 在 Kubernetes 集群中，当某个节点发生故障时，通过以下机制快速恢复服务： 1、节点故障检测 - **节点控制器（Node Controller）** 定期检查节点状态（...

# Kubernetes # 云原生 # 容器编排

2年前

03114

Kubernetes节点宕机后如何加速Pod漂移恢复

一、节点宕机快速恢复服务 > 说明：当节点故障时，k8s集群中默认需要等待5分钟，才能进行漂移。 1.1 环境准备 1、清除node02节点上的污点 2、创建测试应用应用 1.2 节点宕机快速恢复服务 1...

# Kubernetes # 云原生 # 容器编排

2年前

0288

上一页 1…12 131415 16…31 下一页跳转