AI 与智能体 第10页
LLaMA-Factory 微调 Qwen3-4B 实战:启动训练、测试与导出-AI运维探索者

LLaMA-Factory 微调 Qwen3-4B 实战:启动训练、测试与导出

一、启动 WebUI 在开始训练前,先把前面的测试命令结束掉,然后启动 WebUI: 浏览器访问: `http://ip:7860` 如果使用的是 AutoDL,仍然需要做自定义服务映射。 需要注意的是:WebUI 版本更适合...
Dify+MySQL MCP:数据库运维智能体落地-AI运维探索者

Dify+MySQL MCP:数据库运维智能体落地

一、部署MySQL 以下基于Rocky9 先安装MySQL8.0 启动服务 设置root密码 测试root密码是否可以登录 二、部署mysql mcp 项目地址:https://github.com/benborla/mcpservermysql.git 同学推荐: htt...
MCP 入门:它是什么,和 Function Calling 有什么区别-AI运维探索者

MCP 入门:它是什么,和 Function Calling 有什么区别

一、什么是 MCP MCP 的全称是 Model Context Protocol,由 Anthropic 在 2024 年 11 月提出并开源。 它的目标很直接:解决大模型与外部数据源、工具之间的标准化通信问题。 过去常见的问题是: ...
GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘-AI运维探索者

GPU 监控进阶:Prometheus 接入 dcgm-exporter 与显卡大盘

一、为什么还需要 `dcgm-exporter` `node_exporter` 能看到系统级指标,但看不到足够细的 GPU 运行细节。而大模型推理和训练最关心的常常是: * GPU 利用率; * 显存占用; * 温度和功耗; * 显...
OpenClaw高频Skills推荐:主动协作、MCP接入、Web检索与安全审查-AI运维探索者

OpenClaw高频Skills推荐:主动协作、MCP接入、Web检索与安全审查

一、proactiveagentskill:主动协作 1.1 它可以做什么 proactiveagentskill 是一个让代理从“被动接单”变成“主动协作”的方法论技能包,核心价值是:不丢上下文、能持续记忆、会定时主动检查...
Vercel部署实战:从导入GitHub到绑定域名-AI运维探索者

Vercel部署实战:从导入GitHub到绑定域名

一、先准备 Vercel 账号 访问:https://vercel.com/ 通常可以直接使用 GitHub 账号登录。 二、导入 GitHub 项目 进入 Vercel 后,新建项目,然后选择导入 GitHub 仓库。 三、配置环境变量 如果...
大模型压测入门:核心指标与常见压测工具-AI运维探索者

大模型压测入门:核心指标与常见压测工具

一、大模型压测为什么特别重要 相比传统 API,大模型服务的性能不只是“请求快不快”,还涉及: * 首个 Token 出来的速度; * 后续 Token 生成的节奏; * 并发下吞吐是否塌陷; * GPU 利用率是...
用 DistillKit 做大模型蒸馏:Qwen3-8B 到 Qwen3-0.6B-AI运维探索者

用 DistillKit 做大模型蒸馏:Qwen3-8B 到 Qwen3-0.6B

一、DistillKit 是什么 DistillKit 是 Arcee.AI 开源的大模型蒸馏工具包,目标是让研究和工程团队更容易实践多种蒸馏方法。 它支持的主要方向包括: * 基于 logits 的蒸馏; * 基于隐藏状态的蒸...
Transformer 为什么成为大模型核心架构-AI运维探索者

Transformer 为什么成为大模型核心架构

一、Transformer 解决了什么问题 传统模型(RNN/LSTM) * 痛点:无法并行处理、长距离依赖失效、上下文理解局限 * 举例:传话游戏,只能一传一,不能互相通信,第1个人接收到的信息跟第10个人比肯定会...
Unsloth 微调 Qwen3-4B 实战:训练、推理与 vLLM 部署-AI运维探索者

Unsloth 微调 Qwen3-4B 实战:训练、推理与 vLLM 部署

一、先配置训练器 示例里使用的是 `SFTTrainer`: - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`: * 用梯度累积模拟更大的 batch。 * `warmup_steps`: * 训练初期逐步升高学...