AI 与智能体-AI运维探索者-第10页

更新

浏览

FastGPT 项目实战：做一个公司内部员工智能问答助手

一、项目目标目标是做一个公司内部员工智能问答助手，能够基于以下资料回答问题： * 员工手册； * 各部门培训手册； * 技术部内部资源使用说明。最终可以把这个助手发布到公司内部 OA 或门户...

# RAG # 知识库 # 检索增强生成

10个月前

03115

Coze+Ansible实战：环境准备、API服务与Playbook

一、准备 Ansible 环境 1、准备两台机器，机器配置无需太高，比如1c2g，这里建议大家使用阿里云按量付费机器。 2、安装Ansible 两台机器都执行说明：以下命令为阿里云alibaba cloud linux系统 ...

# 智能体 # 工作流编排 # 工具调用

10个月前

03111

Transformer 编码器与解码器：一篇看懂核心结构

一、先看 Transformer 的整体结构架构图：示例：输入:'The cat sat on the mat'--->输出:'猫坐在垫子上' **输入阶段:** * 1）词嵌入(Word Embedding) * 将每个单词转换为512维向量,例如: *...

# 工程实践 # 大模型工程 # 模型部署

8个月前

03115

大模型微调怎么选：技术选型与 SFT、DPO、PPO、RLHF

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务： * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务： * 例如简单分类、关键词提取。 *...

# 工程实践 # 大模型工程 # 模型部署

8个月前

03112

大模型私有化部署前，如何估算硬件配置

- 一、硬件核心配置逻辑 - 1.1 GPU 选型原则 * 显存容量：每 10 亿参数（1B）大约需要 1-2GB 显存，例如 70B 模型通常需要 80GB 级别显存，常见推荐是 A100 或 H100。 * 计算能力：优先选择 FP1...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0309

开源版 Coze 私有部署实战：用 Docker 跑起 Coze Studio

一、先准备机器一个入门级实验环境就够了： * CPU：2C * 内存：4G * 磁盘：40G * 系统：Ubuntu 22.04 如果你只是做实验，使用云上的抢占式实例会更省钱，用完及时销毁即可。二、安装 Docker ...

# Docker # 智能体 # 工作流编排

9个月前

03012

大模型压测入门：核心指标与常见压测工具

一、大模型压测为什么特别重要相比传统 API，大模型服务的性能不只是“请求快不快”，还涉及： * 首个 Token 出来的速度； * 后续 Token 生成的节奏； * 并发下吞吐是否塌陷； * GPU 利用率是...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0306

Unsloth 微调 Qwen3-4B 实战：训练、推理与 vLLM 部署

一、先配置训练器示例里使用的是 `SFTTrainer`： - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`： * 用梯度累积模拟更大的 batch。 * `warmup_steps`： * 训练初期逐步升高学...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0297

Vercel部署实战：从导入GitHub到绑定域名

一、先准备 Vercel 账号访问：https://vercel.com/ 通常可以直接使用 GitHub 账号登录。二、导入 GitHub 项目进入 Vercel 后，新建项目，然后选择导入 GitHub 仓库。三、配置环境变量如果...

# 开发工作流 # GitHub # Vercel

4个月前

0296

Coze 智能体实战：把儿童绘本工作流封装成可用 Agent

一、这一步要做什么前一篇已经把儿童绘本工作流搭好了，接下来要做的是： * 把工作流挂到智能体上； * 配置智能体人设； * 配置欢迎语和预设问题； * 优化交互体验，让它更像一个真正能用的儿...

# 智能体 # 工作流编排 # 工具调用

10个月前

02812