最新发布第89页
Kubernetes GPU资源调度落地-AI运维探索者

Kubernetes GPU资源调度落地

一、K8s集群部署 1.1 Runtime安装 1、卸载已经安装的 docker 2、配置源 3、安装 Containerd 4、配置 Containerd 的内核 5、创建 Containerd 的配置文件 6、启动Containerd 1.2 Kubernetes 部署 ...
Helm:Chart模板流程控制if_with_range-AI运维探索者

Helm:Chart模板流程控制if_with_range

一、if 1、修改values.yaml 2、修改service.yaml **说明:在if else end 左边加-,是为了去掉空行。{{- 表示删除左边的所有空格,直到非空格字符,而 -}}表示删除右边的所有空格。注意,换行符...
大模型微调怎么选:技术选型与 SFT、DPO、PPO、RLHF-AI运维探索者

大模型微调怎么选:技术选型与 SFT、DPO、PPO、RLHF

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务: * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务: * 例如简单分类、关键词提取。 *...
Kubernetes基础:DaemonSet-AI运维探索者

Kubernetes基础:DaemonSet

一、创建YAML文件 二、使用YAML创建ds 三、查看 如果只在node节点上启动了pod,没有在master上启动,这是因为默认master有限制。 说明:Taint叫做污点,如果某一个节点上有污点,则不会被调度运...
Prometheus 容器监控:接入 cAdvisor-AI运维探索者

Prometheus 容器监控:接入 cAdvisor

一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
AI辅助编程入门:GLM4.6 与 AI 编程工具全景-AI运维探索者

AI辅助编程入门:GLM4.6 与 AI 编程工具全景

一、AI 编程为什么会成为新的开发范式 从编程语言演化来看,开发工具经历了几个明显阶段: 汇编和早期高级语言; 面向对象与框架时代; 再到今天的 AI 辅助开发时代。 这一阶段的典型工具包括:...
MongoDB 的使用规范-AI运维探索者

MongoDB 的使用规范

一、数据库的使用规范 数据库通过名字表示。关于数据库的命名需要注意以下几点: 1、编码格式必须为 UTF-8 字符,数据库名不可以出现空字符串,即 ''; 2、只能使用 ASCII 码表中的字母和数字,禁止...
ECK实战:在Kubernetes中从零落地日志收集平台-AI运维探索者

ECK实战:在Kubernetes中从零落地日志收集平台

一、在K8s中从零落地日志收集平台 官方文档:https://www.elastic.co/docs/deploy-manage/deploy/cloud-on-k8s 1.1 ECK安装 参考链接:https://www.elastic.co/docs/deploy-manage/deploy/cloud...
Redis 哨兵模式部署与故障切换-AI运维探索者

Redis 哨兵模式部署与故障切换

一、简介 **简介** 哨兵核心功能:能够后台监控redis主机是否故障,如果故障了根据投票数自动将从库转换为主库 **原理** - 分布式架构,若干个sentinel节点,每个哨兵对其余哨兵和redis监控,节点不...
MySQL日志基础与常用类型:general_log、error_log 与日志分类-AI运维探索者

MySQL日志基础与常用类型:general_log、error_log 与日志分类

一、数据库服务日志概述介绍 任何一种数据库中,都会有各种各样的日志,记录这数据库工作的方方面面,以帮助数据库管理员追踪数据库曾经发生过的各种事件; 主要是针对数据库server层产生的数据...