工程实践-AI运维探索者-第5页

大模型行业选型建议：法律、能源、农业与文旅

一、法律行业 | 细分领域 | 核心要求 | 推荐模型 | 关键能力 | | -------- | ---------------------- | --------------------- | ---------------------------- | | 合同审查 | 条款风险识别、...

8个月前

03214

一、前言本文主要以下几方面介绍Gin相关基础知识: * 为什么要使用框架写项目 * 常见的Go语言框架及对比 * 前后端分离 * 什么是JSON * HTTP请求类型介绍二、为什么要使用框架写项目在 Go 语言...

3年前

0329

一、认识开发语言点击[开发语言排行](https://www.tiobe.com/tiobe-index/)查看2023年开发语言排行点击[开发语言从业者收入](https://codesubmit.io/blog/software-engineer-salary-by-countr...

3年前

03210

一、K8s集群部署 1.1 Runtime安装 1、卸载已经安装的 docker 2、配置源 3、安装 Containerd 4、配置 Containerd 的内核 5、创建 Containerd 的配置文件 6、启动Containerd 1.2 Kubernetes 部署 ...

9个月前

0325

一、安装VSCode 1.点击[VSCode官网](https://code.visualstudio.com/download)，选择对应的版本进行下载，这里我是windows 2.双击安装包，点击【下一步】 3.选择安装目录，点击【下一步】 4.点...

3年前

0328

一、先看 Transformer 的整体结构架构图：示例：输入:'The cat sat on the mat'--->输出:'猫坐在垫子上' **输入阶段:** * 1）词嵌入(Word Embedding) * 将每个单词转换为512维向量,例如: *...

8个月前

03115

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务： * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务： * 例如简单分类、关键词提取。 *...

8个月前

03112

- 一、硬件核心配置逻辑 - 1.1 GPU 选型原则 * 显存容量：每 10 亿参数（1B）大约需要 1-2GB 显存，例如 70B 模型通常需要 80GB 级别显存，常见推荐是 A100 或 H100。 * 计算能力：优先选择 FP1...

8个月前

0309

一、大模型压测为什么特别重要相比传统 API，大模型服务的性能不只是“请求快不快”，还涉及： * 首个 Token 出来的速度； * 后续 Token 生成的节奏； * 并发下吞吐是否塌陷； * GPU 利用率是...

8个月前

0306

一、先配置训练器示例里使用的是 `SFTTrainer`： - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`： * 用梯度累积模拟更大的 batch。 * `warmup_steps`： * 训练初期逐步升高学...

8个月前

0307