AI 与智能体-AI运维探索者-第2页

更新

浏览

大模型微调入门：为什么需要微调与常见技术路线

一、为什么需要微调微调的核心价值，通常体现在下面几个方面： * 解决预训练模型“通用但不够专”的问题。 * 处理目标场景与预训练数据之间的数据分布差异。 * 在有限计算资源下，用更高效的方...

# 工程实践 # 大模型工程 # 模型部署

8个月前

05710

常见开源大模型微调工具盘点：PEFT、LLaMA-Factory、Unsloth、XTuner

一、Hugging Face Transformers 与 PEFT Transformers 是 Hugging Face 的核心开源库，覆盖 NLP、视觉、音频等多种任务，同时把模型加载、Tokenizer、Pipeline 等常见能力做了模块化封装。 PEFT...

# 工程实践 # 大模型工程 # 模型部署

7个月前

05611

Unsloth 微调 Qwen3-4B 实战：环境、模型加载与 LoRA 配置

- 一、先看硬件和软件要求 - 1.1 硬件要求 * GPU：至少 10GB 显存，例如 T4、V100 或更高。 * 内存：至少 16G。 * 存储：建议 50G 以上。 - 1.2 软件环境 * Linux（推荐 Ubuntu） * Python 3.8 ...

# 工程实践 # 大模型工程 # 模型部署

8个月前

05614

讯飞星辰零代码微调 Qwen3-4B 实战

一、先做微调前测试目标模型：`Qwen3-4B` 模型集市地址： `https://training.xfyun.cn/modelSquare` 进入后选择 `Qwen3-4B`，点击“体验”。可以先准备几条测试问题，例如： * “阿铭linux是...

# 工程实践 # 大模型工程 # 模型部署

7个月前

0565

Claude Code 与 Codex：命令行 AI 编程助手实战

一、Claude Code 是什么 Claude Code 是 Anthropic 推出的终端原生 AI 编程助手，核心特点是：直接运行在命令行里；更适合复杂任务、多步骤修改和大型代码库理解；能把自然语言指令转成实际...

# AI编程 # Agent # Codex

4个月前

0569

RAG 入门：它是什么，解决了什么问题，核心原理是什么

一、什么是 RAG RAG 是 `Retrieval-Augmented Generation` 的缩写，中文通常翻译为“检索增强生成”。它的核心思路非常直接： 1. 用户先提出问题； 2. 系统先去外部知识库里检索相关内容； 3. ...

# RAG # 知识库 # 检索增强生成

10个月前

05511

用 EvalScope 压测 Qwen3-8B：从环境准备到指标解读

一、压测对象这份实战使用的是硅基流动提供的免费 `Qwen3-8B` 服务。模型入口示意：获取 API Key 的流程同样在平台控制台中完成。公开文档里只建议写成： * `SILICONFLOW_API_KEY=` 二、准...

# 工程实践 # 大模型工程 # 模型部署

7个月前

0558

AI克隆网站实战：从v0生成原型到二次开发

一、v0 是什么 v0.app 是 Vercel 推出的 AI 驱动建站工具，强调从自然语言描述快速生成 Web 应用原型或可部署前端。类似工具还有： https://same.new/ 这类工具的共同优势是：能极快把“想法”...

# AI编程 # 开发工作流 # v0

4个月前

05515

Dify+Elasticsearch MCP：搜索与日志运维智能体

一、准备ElasticSearch环境服务器：Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码访问 1.7 基础操作创建索引假设我们要创...

# 智能体 # Elasticsearch # 工具调用

4个月前

0546

Dify+Jenkins MCP：构建CI-CD运维智能体

一、部署Jenkins MCP 就在Jenkins那台机器上部署，系统版本：Rocky9 项目地址：https://github.com/lanbaoshen/mcpjenkins 基于docker部署，需要先安装docker环境先pull容器镜像然后启动容器 ...

# CI/CD # Jenkins # 智能体

3个月前

0538