AI 与智能体 第9页
讯飞星辰零代码微调 Qwen3-4B 实战-AI运维探索者

讯飞星辰零代码微调 Qwen3-4B 实战

一、先做微调前测试 目标模型:`Qwen3-4B` 模型集市地址: `https://training.xfyun.cn/modelSquare` 进入后选择 `Qwen3-4B`,点击“体验”。 可以先准备几条测试问题,例如: * “阿铭linux是...
OpenClaw入门:它是什么、怎么工作、适合哪些场景-AI运维探索者

OpenClaw入门:它是什么、怎么工作、适合哪些场景

一、了解 OpenClaw 1.1 什么是 OpenClaw 官网:https://openclaw.ai/ Githubt地t址:https://github.com/openclaw/openclaw OpenClaw是一种开源、自托管(selfhosted)的AI自动化代理系统/智能体框...
FastGPT 入门与安装:功能定位、应用场景和 Docker 部署-AI运维探索者

FastGPT 入门与安装:功能定位、应用场景和 Docker 部署

一、FastGPT 是什么 FastGPT 是一个基于大语言模型的开源知识库问答系统,目标是帮助用户快速构建专属 AI 助手,尤其适合企业内部文档问答和复杂知识检索场景。 二、FastGPT 的核心能力 2.1 知...
大模型微调怎么选:技术选型与 SFT、DPO、PPO、RLHF-AI运维探索者

大模型微调怎么选:技术选型与 SFT、DPO、PPO、RLHF

- 一、技术选型时先看什么 - 1.1 按任务复杂度选 * 高复杂度任务: * 例如多轮对话、复杂推理、长文本生成。 * 更适合全参数微调或指令微调。 * 低复杂度任务: * 例如简单分类、关键词提取。 *...
Coze 快速上手:工作空间、工作流与基础体验-AI运维探索者

Coze 快速上手:工作空间、工作流与基础体验

一、先认识 Coze 的基本入口 地址: `https://www.coze.cn/home` 进入之后,你通常会接触到几类核心入口: * 创建智能体; * 创建应用; * 工作空间; * 资源库; * 模板; * API。 工作空间主...
GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘-AI运维探索者

GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘

一、为什么还需要 `dcgm-exporter` `node_exporter` 能看到系统级指标,但看不到足够细的 GPU 运行细节。而大模型推理和训练最关心的常常是: * GPU 利用率; * 显存占用; * 温度和功耗; * 显...
大模型选型指南:性能、参数与安全性-AI运维探索者

大模型选型指南:性能、参数与安全性

一、性能与场景适配度 1.1 通用能力 评估模型在数学推理、代码生成、多语言支持等通用任务上的表现。例如,通义千问在多项评测中表现突出,DeepSeek-R1 在复杂推理任务中也有明显优势。 1.2 行...
阿里云百炼 MCP 实战:做一个旅游规划助手-AI运维探索者

阿里云百炼 MCP 实战:做一个旅游规划助手

一、要接入哪些 MCP 服务 这个案例里一共用到了四类能力: 高德地图: 路线规划、景点与周边信息。 12306 火车票: 查询铁路出行方案。 飞常准: 查询航班相关信息。 EdgeOne Pages: 把最终旅...
Dify+k8s运维智能体:单机Kubernetes部署-AI运维探索者

Dify+k8s运维智能体:单机Kubernetes部署

一、部署单机 Kubernetes 前的准备工作 为了节省成本,这里我们可以部署一台单机版的k8s 机器配置建议:CUP:2c, 内存:4G, 磁盘:40G 1、关闭防火墙firewalld、selinux 2、设置主机名 设置/e...
Unsloth 微调 Qwen3-4B 实战:训练、推理与 vLLM 部署-AI运维探索者

Unsloth 微调 Qwen3-4B 实战:训练、推理与 vLLM 部署

一、先配置训练器 示例里使用的是 `SFTTrainer`: - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`: * 用梯度累积模拟更大的 batch。 * `warmup_steps`: * 训练初期逐步升高学...