最新发布第47页
Redis集群一键扩容与删除-AI运维探索者

Redis集群一键扩容与删除

一、Redis集群一键扩容 无论数据是否持久化,操作步骤基本上是查不多的 1.1 方式一 1.修改配置文件 如果是数据持久化,需要修改persistent.yaml,将masterSize数修改为4 如果是数据非持久化,需...
Kubernetes管理GPU和大模型技术体系-AI运维探索者

Kubernetes管理GPU和大模型技术体系

一、K8s管理GPU资源技术架构 k8s默认不支持管理GPU 安装完英伟达驱动后支持管理GPU 二、K8s管理大模型服务方案 针对vLLM serve、Ollama serve等各类大模型服务,可以使用资源类型为Deployment进...
Ingress 常见报错排查:404、413、503、504 与 CORS 处理-AI运维探索者

Ingress 常见报错排查:404、413、503、504 与 CORS 处理

一、404(Not Found)报错 404表示访问的路由不存在,通常问题如下: * 1) Ingress 路径配置的不正确 * 2) Ingress 的配置未被Controller 解析 * 3) 未使用正确的域名和路径访问 * 4) 代理...
SSH登录并执行文本文件命令-AI运维探索者

SSH登录并执行文本文件命令

一、脚本运行前提 - 通过SSH登录 - 需要登录设备管理地址统一放在一个文件类型为.txt的文本文件,这里习惯命名为ip_list.txt - 需要执行的命令统一放在一个文件类型为.txt的文本文件,这里习惯...
ECK日志采集核心:Beat资源与Filebeat配置详解-AI运维探索者

ECK日志采集核心:Beat资源与Filebeat配置详解

一、ECK核心资源Beat配置详解 ECK核心资源Beat配置示例: 1.1 FileBeat配置详解 1.1 FileBeat基于k8s自动发现配置 ECK核心资源FileBeat配置示例: 1.1 FileBeat基于inputs配置 ECK核心资源FileB...
Helm模板语法详解:内置变量、常用函数与流程控制-AI运维探索者

Helm模板语法详解:内置变量、常用函数与流程控制

一、Helm语法详解 1.1 Helm内置变量 对象可以通过模板引擎传递到模板中。 当然你的代码也可以传递对象。(我们在使用`with`和`range`语句时,会看到示例)。有几种方式可以在模板中创建新对象,...
Jenkins Pipeline 进阶:脚本化 Pipeline、共享库与 Jenkinsfile 提效-AI运维探索者

Jenkins Pipeline 进阶:脚本化 Pipeline、共享库与 Jenkinsfile 提效

一、脚本化Pipeline 1.1 脚本化Pipeline 脚本化流水线, 与声明式一样的是, 是建立在底层流水线的子系统上的。与声明式不同的是, 脚本化流水线实际上是由 `Groovy`构建的通用 `DSL` 。 `Groovy` ...
Kubernetes扩展:Operator理论知识-AI运维探索者

Kubernetes扩展:Operator理论知识

一、1)Operator是什么。 你可以理解成Operator就是CRD+自定义Controller的实践应用。 Kubernetes Operator由CoreOS公司开发,它是一种自定义控制器,它扩展了 Kubernetes API 的功能,用于管理...
Deployment 发布策略详解:Recreate、RollingUpdate 与零中断参数设计-AI运维探索者

Deployment 发布策略详解:Recreate、RollingUpdate 与零中断参数设计

一、Deployment 只有两种主流更新策略 Deployment 的更新策略主要有两类: - `Recreate` - `RollingUpdate` 默认值是 `RollingUpdate`。它们的区别并不抽象,可以直接理解成两种上线哲学: - `R...
Kubernetes 大规模集群:apiserver 性能优化与分析-AI运维探索者

Kubernetes 大规模集群:apiserver 性能优化与分析

一、参数调整 kube-apiserver 以下两个参数可以控制连接数: 节点数量在 1000 - 3000 之间时,推荐: 节点数量大于 3000 时,推荐 当集群中 node 以及 pod 数量非常多时可以稍微调大: - 二、api...