AI运维探索者 - 从Script到Agent，一个运维人的AI实践笔记-最新发布-第34页

代码管理入门：Git、代码仓库与版本控制实践

一、为什么需要代码管理 1.1 为什么引入代码管理写代码时我们一般不可能一天写完，大部分都是分批来写的，这就导致我们无法准备记住每天写了哪些代码？这时就需要对代码进行管理。另外，代码团...

3年前

03712

大模型行业选型建议：法律、能源、农业与文旅

一、法律行业 | 细分领域 | 核心要求 | 推荐模型 | 关键能力 | | -------- | ---------------------- | --------------------- | ---------------------------- | | 合同审查 | 条款风险识别、...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

02814

大模型微调怎么选：技术选型与 SFT、DPO、PPO、RLHF

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务： * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务： * 例如简单分类、关键词提取。 *...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

02912

大模型微调数据集入门：常见分类与数据格式

一、什么是大模型微调数据集简单说，微调数据集就是一批专门为某个目标准备的数据，用来让一个已经很强的通用模型，进一步学会特定任务、特定风格或特定领域知识。二、常见数据集分类 2.1 指...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

0386

大模型微调超参数详解：从 Model Size 到 Temperature

一、超参数到底是什么超参数（Hyperparameters）是在训练开始前就要设定好的参数，用来控制训练过程，而不是训练中自动学到的权重。一个很直观的比喻是：超参数就像做菜前先决定盐、胡椒、火...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

03813

大模型推理优化总览：硬件、系统架构与服务部署

一、大模型优化的核心目标优化通常围绕四个目标展开： * 降低延迟： * 尤其是首个 Token 时间和生成速度。 * 提高吞吐： * 在固定资源下服务更多请求。 * 降低成本： * 提升资源利用率，降低单...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

0476

大模型是什么，它为什么重要

一、先认识什么是大模型 1.1 常见的大模型常见的大模型： * ChatGPT * DeepSeek * 豆包 * 腾讯元宝 1.2 大模型的定义大模型定义： * 大语言模型(LLM) * 关键字:大 --> 参数规模比较大、训...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

0428

大模型知识蒸馏入门：原理、方法与百度千帆实战

一、什么是知识蒸馏知识蒸馏（Knowledge Distillation）是一种模型压缩技术，核心思想是： * 用一个更大的教师模型指导一个更小的学生模型； * 让学生模型在更低资源占用下，尽量接近教师模型...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

02214

大模型私有化部署前，如何估算硬件配置

- 一、硬件核心配置逻辑 - 1.1 GPU 选型原则 * 显存容量：每 10 亿参数（1B）大约需要 1-2GB 显存，例如 70B 模型通常需要 80GB 级别显存，常见推荐是 A100 或 H100。 * 计算能力：优先选择 FP1...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

0279

大模型私有化部署硬件选型策略与企业案例

- 一、先按需求驱动做决策 - 1.1 数据安全与合规性优先适用场景 * 金融、医疗、政府等需要遵守数据安全与个人信息保护要求的行业。 * 涉及国家机密，或者跨境数据传输受限的企业。硬件选型要...

大模型工程 # 工程实践 # 大模型工程 # 模型部署

7个月前

02911

上一页 1…32 333435 36…122 下一页跳转