大模型工程-AI运维探索者-第2页

Transformer 编码器与解码器：一篇看懂核心结构

一、先看 Transformer 的整体结构架构图：示例：输入:'The cat sat on the mat'--->输出:'猫坐在垫子上' **输入阶段:** * 1）词嵌入(Word Embedding) * 将每个单词转换为512维向量,例如: *...

大模型工程

8个月前

03115

腾讯云 HAI 体验：从创建实例到 OpenWebUI 测试

一、先创建 HAI 实例地址： `https://cloud.tencent.com/product/hai` 1.1 进入 HAI 控制台打开官网后，点击“立即使用”。 1.2 新建算力实例进入： `算力管理 -> 新建` 1.3 填写实例参数...

大模型工程

7个月前

03713

大模型微调入门：为什么需要微调与常见技术路线

一、为什么需要微调微调的核心价值，通常体现在下面几个方面： * 解决预训练模型“通用但不够专”的问题。 * 处理目标场景与预训练数据之间的数据分布差异。 * 在有限计算资源下，用更高效的方...

大模型工程

8个月前

05710

大模型运维监控入门：命令行工具、Prometheus 与 Grafana

一、先用命令行工具做最小监控 1.1 NVIDIA GPU：`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具，前提是已经安装好显卡驱动。常见用法：它最适合做： * 快速排查显存占用； * 看当前...

大模型工程

8个月前

0518

Unsloth 微调 Qwen3-4B 实战：环境、模型加载与 LoRA 配置

- 一、先看硬件和软件要求 - 1.1 硬件要求 * GPU：至少 10GB 显存，例如 T4、V100 或更高。 * 内存：至少 16G。 * 存储：建议 50G 以上。 - 1.2 软件环境 * Linux（推荐 Ubuntu） * Python 3.8 ...

大模型工程

8个月前

05614

讯飞星辰零代码微调 Qwen3-4B 实战

一、先做微调前测试目标模型：`Qwen3-4B` 模型集市地址： `https://training.xfyun.cn/modelSquare` 进入后选择 `Qwen3-4B`，点击“体验”。可以先准备几条测试问题，例如： * “阿铭linux是...

大模型工程

7个月前

0565

大模型微调怎么选：技术选型与 SFT、DPO、PPO、RLHF

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务： * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务： * 例如简单分类、关键词提取。 *...

大模型工程

8个月前

03112

GPU 监控进阶：Prometheus 接入 dcgm-exporter 与显卡大盘

一、为什么还需要 `dcgm-exporter` `node_exporter` 能看到系统级指标，但看不到足够细的 GPU 运行细节。而大模型推理和训练最关心的常常是： * GPU 利用率； * 显存占用； * 温度和功耗； * 显...

大模型工程

9个月前

0368

大模型选型指南：性能、参数与安全性

一、性能与场景适配度 1.1 通用能力评估模型在数学推理、代码生成、多语言支持等通用任务上的表现。例如，通义千问在多项评测中表现突出，DeepSeek-R1 在复杂推理任务中也有明显优势。 1.2 行...

大模型工程

8个月前

0275

Unsloth 微调 Qwen3-4B 实战：训练、推理与 vLLM 部署

一、先配置训练器示例里使用的是 `SFTTrainer`： - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`： * 用梯度累积模拟更大的 batch。 * `warmup_steps`： * 训练初期逐步升高学...

大模型工程

8个月前

0297