AI 与智能体 第2页
大模型微调入门:为什么需要微调与常见技术路线-AI运维探索者

大模型微调入门:为什么需要微调与常见技术路线

一、为什么需要微调 微调的核心价值,通常体现在下面几个方面: * 解决预训练模型“通用但不够专”的问题。 * 处理目标场景与预训练数据之间的数据分布差异。 * 在有限计算资源下,用更高效的方...
常见开源大模型微调工具盘点:PEFT、LLaMA-Factory、Unsloth、XTuner-AI运维探索者

常见开源大模型微调工具盘点:PEFT、LLaMA-Factory、Unsloth、XTuner

一、Hugging Face Transformers 与 PEFT Transformers 是 Hugging Face 的核心开源库,覆盖 NLP、视觉、音频等多种任务,同时把模型加载、Tokenizer、Pipeline 等常见能力做了模块化封装。 PEFT...
Unsloth 微调 Qwen3-4B 实战:环境、模型加载与 LoRA 配置-AI运维探索者

Unsloth 微调 Qwen3-4B 实战:环境、模型加载与 LoRA 配置

- 一、先看硬件和软件要求 - 1.1 硬件要求 * GPU:至少 10GB 显存,例如 T4、V100 或更高。 * 内存:至少 16G。 * 存储:建议 50G 以上。 - 1.2 软件环境 * Linux(推荐 Ubuntu) * Python 3.8 ...
讯飞星辰零代码微调 Qwen3-4B 实战-AI运维探索者

讯飞星辰零代码微调 Qwen3-4B 实战

一、先做微调前测试 目标模型:`Qwen3-4B` 模型集市地址: `https://training.xfyun.cn/modelSquare` 进入后选择 `Qwen3-4B`,点击“体验”。 可以先准备几条测试问题,例如: * “阿铭linux是...
Claude Code 与 Codex:命令行 AI 编程助手实战-AI运维探索者

Claude Code 与 Codex:命令行 AI 编程助手实战

一、Claude Code 是什么 Claude Code 是 Anthropic 推出的终端原生 AI 编程助手,核心特点是: 直接运行在命令行里; 更适合复杂任务、多步骤修改和大型代码库理解; 能把自然语言指令转成实际...
RAG 入门:它是什么,解决了什么问题,核心原理是什么-AI运维探索者

RAG 入门:它是什么,解决了什么问题,核心原理是什么

一、什么是 RAG RAG 是 `Retrieval-Augmented Generation` 的缩写,中文通常翻译为“检索增强生成”。 它的核心思路非常直接: 1. 用户先提出问题; 2. 系统先去外部知识库里检索相关内容; 3. ...
用 EvalScope 压测 Qwen3-8B:从环境准备到指标解读-AI运维探索者

用 EvalScope 压测 Qwen3-8B:从环境准备到指标解读

一、压测对象 这份实战使用的是硅基流动提供的免费 `Qwen3-8B` 服务。 模型入口示意: 获取 API Key 的流程同样在平台控制台中完成。 公开文档里只建议写成: * `SILICONFLOW_API_KEY=` 二、准...
AI克隆网站实战:从v0生成原型到二次开发-AI运维探索者

AI克隆网站实战:从v0生成原型到二次开发

一、v0 是什么 v0.app 是 Vercel 推出的 AI 驱动建站工具,强调从自然语言描述快速生成 Web 应用原型或可部署前端。 类似工具还有: https://same.new/ 这类工具的共同优势是:能极快把“想法”...
Dify+Elasticsearch MCP:搜索与日志运维智能体-AI运维探索者

Dify+Elasticsearch MCP:搜索与日志运维智能体

一、准备ElasticSearch环境 服务器:Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码 访问 1.7 基础操作 创建索引 假设我们要创...
Dify+Jenkins MCP:构建CI-CD运维智能体-AI运维探索者

Dify+Jenkins MCP:构建CI-CD运维智能体

一、部署Jenkins MCP 就在Jenkins那台机器上部署,系统版本:Rocky9 项目地址:https://github.com/lanbaoshen/mcpjenkins 基于docker部署,需要先安装docker环境 先pull容器镜像 然后启动容器 ...