工程实践-AI运维探索者-第2页

更新

浏览

LLaMA-Factory 微调 Qwen3-4B 实战：启动训练、测试与导出

一、启动 WebUI 在开始训练前，先把前面的测试命令结束掉，然后启动 WebUI：浏览器访问： `http://ip:7860` 如果使用的是 AutoDL，仍然需要做自定义服务映射。需要注意的是：WebUI 版本更适合...

大模型工程

8个月前

02814

Go 接口实战：interface、空接口、类型断言与接口嵌套

一、前言本文主要以下几方面介绍Go语言中接口: * 初识接口 * 接口使用 * 空接口 * 类型断言 * 接口嵌套二、初识接口 2.1 理解接口对于Go语言中的接口，我们可以从现实生活出发，可以更好的理...

3年前

0506

大模型为什么离不开 GPU

一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别： | | CPU | GPU | | -------------------------- | --------------------------------------------...

大模型工程

8个月前

0537

常见主流开源大模型盘点

一、先看主流开源大模型全景 | 大模型 | 代表模型 | 公司 | 特点 | | ------------ | ------------- | ---------------- | ------------------------------------------------------------ | | ...

大模型工程

8个月前

0385

大模型私有化部署前，如何估算硬件配置

- 一、硬件核心配置逻辑 - 1.1 GPU 选型原则 * 显存容量：每 10 亿参数（1B）大约需要 1-2GB 显存，例如 70B 模型通常需要 80GB 级别显存，常见推荐是 A100 或 H100。 * 计算能力：优先选择 FP1...

大模型工程

8个月前

0309

LLaMA-Factory 微调 Qwen3-4B 实战：环境准备与数据配置

一、先明确整体思路这套流程的目标是：在 AutoDL 云服务器上安装 `LLaMA-Factory`，然后对 `Qwen3-4B` 做微调。二、环境准备 2.1 购买云主机笔记里建议使用 AutoDL，选择 3090 显卡即可。如...

大模型工程

8个月前

04812

Go 数据结构与数据处理：数组、切片、Map、字符串和指针

一、Go数据结构-数组基本使用 1.1 什么是数组在 Go 语言中，数组（Array）是一种用于存储一组相同类型元素的数据结构。数组的长度是固定的，一旦定义后，其大小不能改变。数组在 Go 中是值类型...

3年前

0568

大模型压测入门：核心指标与常见压测工具

一、大模型压测为什么特别重要相比传统 API，大模型服务的性能不只是“请求快不快”，还涉及： * 首个 Token 出来的速度； * 后续 Token 生成的节奏； * 并发下吞吐是否塌陷； * GPU 利用率是...

大模型工程

8个月前

0306

常见主流闭源大模型盘点

一、主流闭源大模型概览 | 模型 | 代表模型 | 公司 | 特点 | | -------- | ---------------------- | ------------ | ------------------------------------------------------------ | | GPT ...

大模型工程

7个月前

0518

大模型私有化部署硬件选型策略与企业案例

- 一、先按需求驱动做决策 - 1.1 数据安全与合规性优先适用场景 * 金融、医疗、政府等需要遵守数据安全与个人信息保护要求的行业。 * 涉及国家机密，或者跨境数据传输受限的企业。硬件选型要...

大模型工程

8个月前

03311