AI 与智能体-AI运维探索者-第9页

更新

浏览

Coze 工作流实战：搭建一个儿童绘本生成工作流

一、整体流程是什么这套工作流可以拆成 5 个核心节点： 1. 开始节点： * 接收用户输入。 2. 分镜节点： * 根据主题生成多张漫画画面的镜头描述。 3. 故事节点： * 根据分镜生成儿童绘本文案。 ...

# 智能体 # 工作流编排 # 工具调用

10个月前

03814

向量数据库入门：向量是什么，为什么 RAG 离不开它

一、向量是什么在 AI 场景里，向量可以理解成一个“很长的数字列表”，例如：这个数字列表不是随便生成的，它通常承载了原始数据的语义或特征。例如： * 一张图片会被编码成代表颜色、形状、...

# RAG # 知识库 # 检索增强生成

10个月前

03610

大模型运维监控入门：命令行工具、Prometheus 与 Grafana

一、先用命令行工具做最小监控 1.1 NVIDIA GPU：`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具，前提是已经安装好显卡驱动。常见用法：它最适合做： * 快速排查显存占用； * 看当前...

# 监控告警 # Prometheus # 工程实践

8个月前

0518

阿里云百炼 MCP 快速体验：从自定义服务到第一个智能体

一、什么是阿里云百炼的 MCP 能力地址： https://bailian.console.aliyun.com/?tab=mcp/mcpmarket 百炼不只支持 MCP，也支持智能体应用。它的特点是：不需要自己管理底层资源；不需要自己维...

# 智能体 # 工具调用 # MCP

4个月前

0995

Dify+Jumpserver实战：资产管理工作流与综合型应用

一、创建 Dify 资产管理应用目标：通过自然语言来添加资产（主机） 1、创建空白应用、工作流模式 2、开始节点，添加变量input 3、添加获取当前时间节点因为后面添加主机时，需要当前时间戳 4...

# 工作流编排 # 智能体平台 # 自动化

9个月前

0527

Unsloth 微调 Qwen3-4B 实战：环境、模型加载与 LoRA 配置

- 一、先看硬件和软件要求 - 1.1 硬件要求 * GPU：至少 10GB 显存，例如 T4、V100 或更高。 * 内存：至少 16G。 * 存储：建议 50G 以上。 - 1.2 软件环境 * Linux（推荐 Ubuntu） * Python 3.8 ...

# 工程实践 # 大模型工程 # 模型部署

8个月前

05614

讯飞星辰零代码微调 Qwen3-4B 实战

一、先做微调前测试目标模型：`Qwen3-4B` 模型集市地址： `https://training.xfyun.cn/modelSquare` 进入后选择 `Qwen3-4B`，点击“体验”。可以先准备几条测试问题，例如： * “阿铭linux是...

# 工程实践 # 大模型工程 # 模型部署

7个月前

0565

OpenClaw入门：它是什么、怎么工作、适合哪些场景

一、了解 OpenClaw 1.1 什么是 OpenClaw 官网:https://openclaw.ai/ Githubt地t址:https://github.com/openclaw/openclaw OpenClaw是一种开源、自托管(selfhosted)的AI自动化代理系统/智能体框...

# 智能体 # OpenClaw # AI 自动化

3个月前

0355

FastGPT 入门与安装：功能定位、应用场景和 Docker 部署

一、FastGPT 是什么 FastGPT 是一个基于大语言模型的开源知识库问答系统，目标是帮助用户快速构建专属 AI 助手，尤其适合企业内部文档问答和复杂知识检索场景。二、FastGPT 的核心能力 2.1 知...

# RAG # 知识库 # 检索增强生成

10个月前

0476

大模型微调怎么选：技术选型与 SFT、DPO、PPO、RLHF

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务： * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务： * 例如简单分类、关键词提取。 *...

# 工程实践 # 大模型工程 # 模型部署

8个月前

03112

上一页 1…7 8910 11 下一页跳转