最新发布第15页
Kubernetes服务暴露链路与initContainer场景应用-AI运维探索者

Kubernetes服务暴露链路与initContainer场景应用

一、K8S应用层面的服务暴露方式 K8S 在集群架构层面有三类IP:分别为 Node Network (物理节点网络)、 Pod Network(pod容器网络) 、 Cluster Network(集群网络,也称为 Service NetWork )...
什么是动态存储:CSI、StorageClass 与工作原理-AI运维探索者

什么是动态存储:CSI、StorageClass 与工作原理

一、什么是动态存储 动态存储可以在用户需要存储资源时自动创建和配置动态存储可以在用户需要存储资源时自动创建和配置配变得更加灵活,并且可以随着应用程序的需求变化而动态调整。 二、动态存...
Dify+Jumpserver实战:资产管理工作流与综合型应用-AI运维探索者

Dify+Jumpserver实战:资产管理工作流与综合型应用

一、创建 Dify 资产管理应用 目标:通过自然语言来添加资产(主机) 1、创建空白应用、工作流模式 2、开始节点,添加变量input 3、添加获取当前时间节点 因为后面添加主机时,需要当前时间戳 4...
Docker实战:Golang后端镜像制作与容器化发布流程-AI运维探索者

Docker实战:Golang后端镜像制作与容器化发布流程

一、Golang 服务镜像制作的核心思路 Go 项目的容器化通常比 Java 更直接,因为它经常可以编译出单个二进制文件,最终运行镜像不一定需要完整的语言运行时。 典型流程是: 1. 下载源码 2. 用临时...
Kubernetes基础:Deployment-AI运维探索者

Kubernetes基础:Deployment

一、创建YAML文件 二、使用YAML创建deploy 三、查看 四、查看pod分配到哪个节点上 五、恢复
Pod生命周期与健康检查:启动流程、退出流程和三种探针详解-AI运维探索者

Pod生命周期与健康检查:启动流程、退出流程和三种探针详解

一、Pod 启动过程到底发生了什么 Pod 从创建到真正可接流量,通常会经历这些阶段: 1. 用户提交 Pod 定义,请求进入 API Server 2. 调度器为 Pod 选择节点,此时常见状态是 `Pending` 3. kubele...
常见开源大模型微调工具盘点:PEFT、LLaMA-Factory、Unsloth、XTuner-AI运维探索者

常见开源大模型微调工具盘点:PEFT、LLaMA-Factory、Unsloth、XTuner

一、Hugging Face Transformers 与 PEFT Transformers 是 Hugging Face 的核心开源库,覆盖 NLP、视觉、音频等多种任务,同时把模型加载、Tokenizer、Pipeline 等常见能力做了模块化封装。 PEFT...
Kubernetes服务高可用:从节点、机房与资源分配看Pod调度优化-AI运维探索者

Kubernetes服务高可用:从节点、机房与资源分配看Pod调度优化

一、从节点分配分析服务高可用问题 图中有 4 个副本(Deployment Replicas: 4),分布在 5 个节点(Node01 - Node05)上。其中 Node01 有 3 个 Pod,Node02 有 1 个 Pod,Node04 有 2 个 Pod,N...
Alertmanager 高级配置:接入企业微信告警-AI运维探索者

Alertmanager 高级配置:接入企业微信告警

一、基于企业微信的报警媒介 - **实时告警通知**:企业微信/钉钉等即时通信工具能够实现实时的告警通知,使得团队 成员能够及时响应和解决问题。 - **通知范围更广**:基于企业微信/钉钉的告警...
大模型为什么离不开 GPU-AI运维探索者

大模型为什么离不开 GPU

一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别: | | CPU | GPU | | -------------------------- | --------------------------------------------...