标签: AIOps

2025-10-01 519 次阅读

智能体平台与工作流

智能体入门：什么是 AI Agent，核心要素和主流平台有哪些

智能体之所以这两年突然火起来，不是因为“换了个名字”，而是因为大模型让软件第一次更像一个会观察、会规划、会调用工具、还能主动执行任务的数字助手。

AIOps

阅读全文

2025-09-30 702 次阅读

大模型工程

Unsloth 微调 Qwen3-4B 实战：训练、推理与 vLLM 部署

Unsloth 真正让人上手的关键，不只是它能省显存，而是它能把“训练、保存、推理、再挂成服务”这一整条链路串起来；只要数据准备好了，后半段流程就会非常清晰。

AIOps

阅读全文

2025-09-29 623 次阅读

大模型工程

Unsloth 微调 Qwen3-4B 实战：环境、模型加载与 LoRA 配置

如果说 LLaMA-Factory 更像一套完整框架，那么 Unsloth 更像一条“尽可能高效、省显存、快速跑起来”的微调路线；尤其在单卡环境下，它的体验很有吸引力。

AIOps

阅读全文

2025-09-28 755 次阅读

大模型工程

LLaMA-Factory 微调 Qwen3-4B 实战：启动训练、测试与导出

LLaMA-Factory 真正好用的地方，不只是它能启动训练，而是它同时把 WebUI、命令行、测试和导出都串了起来；这样微调不会停留在“训练完了”，而是能顺势走到验证和落地。

AIOps

阅读全文

2025-09-27 649 次阅读

大模型工程

LLaMA-Factory 微调 Qwen3-4B 实战：环境准备与数据配置

如果你想真正把微调流程握在自己手里，而不是只停留在平台操作层面，那么 `LLaMA-Factory` 是一个很适合作为第一套完整实战框架的工具。

AIOps

阅读全文

2025-09-26 545 次阅读

大模型工程

讯飞星辰零代码微调 Qwen3-4B 实战

如果你不想从命令行和训练脚本起步，而是先验证“大模型微调到底能不能跑通”，那么讯飞星辰这类零代码平台会是一条很适合试水的路径。

AIOps

阅读全文

2025-09-25 851 次阅读

大模型工程

大模型微调超参数详解：从 Model Size 到 Temperature

微调时最容易让人“似懂非懂”的，不是框架安装，而是超参数；它们不会被模型自己学出来，却几乎决定了训练稳定性、资源消耗和最终效果。

AIOps

阅读全文

2025-09-24 564 次阅读

大模型工程

如何获取并制作大模型微调数据集

数据集并不一定非要自己从零写出来，很多时候更现实的路线是“先找公开数据，再按任务补充自制样本”，这样更容易快速启动微调实验。

AIOps

阅读全文

2025-09-23 726 次阅读

大模型工程

大模型微调数据集入门：常见分类与数据格式

微调效果好不好，很多时候不取决于框架，而取决于数据；同样是“喂数据”，不同数据集类型和格式，训练出来的模型行为差异会非常大。

AIOps

阅读全文

2025-09-22 635 次阅读

大模型工程

商业大模型微调平台盘点：阿里云 PAI、硅基流动与讯飞星辰

除了自己搭训练环境，商业平台也提供了更轻量的微调入口；它们的优势通常不在于“最灵活”，而在于能把训练、托管和服务化交付压缩到更短路径里。

AIOps

阅读全文