排序
Coze+Ansible实战:环境准备、API服务与Playbook
一、准备 Ansible 环境 1、准备两台机器,机器配置无需太高,比如1c2g,这里建议大家使用阿里云按量付费机器。 2、安装Ansible 两台机器都执行 说明:以下命令为阿里云alibaba cloud linux系统 ...
Kubernetes驱动的GPU与大模型管理
一、为什么使用k8s管理GPU与大模型 我们可以从下面六个角度进行分析为什么使用k8s管理GPU与大模型: * 资源调度与优化 * 多租户隔离与资源分配 * 简化部署与管理 * 弹性伸缩和负载均衡 * 高可用...
OpenClaw多Agent实战:组织架构、飞书应用与Agent配置
一、规划 OpenClaw 多 Agent 组织架构 思路: 基于多个飞书机器人应用实现,OpenClaw一个主Agent,多个子Agent,每个Agent都有单独的一个workspace,每个飞书机器人对应一个Agent 1.1 设计组织...
RAG 入门:它是什么,解决了什么问题,核心原理是什么
一、什么是 RAG RAG 是 `Retrieval-Augmented Generation` 的缩写,中文通常翻译为“检索增强生成”。 它的核心思路非常直接: 1. 用户先提出问题; 2. 系统先去外部知识库里检索相关内容; 3. ...
常见开源大模型微调工具盘点:PEFT、LLaMA-Factory、Unsloth、XTuner
一、Hugging Face Transformers 与 PEFT Transformers 是 Hugging Face 的核心开源库,覆盖 NLP、视觉、音频等多种任务,同时把模型加载、Tokenizer、Pipeline 等常见能力做了模块化封装。 PEFT...
n8n 节点详解:触发器、控制流、循环、合并与等待
一、触发器节点 1.1 Manual Trigger 最简单的触发器,点击后立即运行,适合调试。 1.2 Schedule Trigger 定时触发,作用类似 Linux 的 Crontab。 1.3 Webhook Webhook 会给你一个 URL,只要访问...
OpenClaw多Agent进阶:SOUL.md、USER.md 与 AGENTS.md 协作机制
一、给不同 Agent 设置角色人设 1.1 技术 Agent 的 SOUL.md 定义SOUL.md 定义USER.md 1.2 内容 Agent 的 SOUL.md 定义SOUL.md 定义USER.md 1.3 运营 Agent 的 SOUL.md USER.md 1.4 财务 Agent ...
RAGFlow 入门:它的特点、适用场景,以及和 FastGPT 的区别
一、RAGFlow 是什么 RAGFlow 是一个基于深度文档理解的开源 RAG 引擎,目标是为企业提供更高质量的知识检索与问答能力。 官网: `https://ragflow.io/` GitHub: `https://github.com/infiniflo...
大模型私有化部署硬件选型策略与企业案例
- 一、先按需求驱动做决策 - 1.1 数据安全与合规性优先 适用场景 * 金融、医疗、政府等需要遵守数据安全与个人信息保护要求的行业。 * 涉及国家机密,或者跨境数据传输受限的企业。 硬件选型要...
RAGFlow 部署与快速体验:Linux 安装、模型配置、知识库和聊天
一、部署前的机器要求 生产环境通常建议: * CPU >= 4 cores * RAM >= 16 GB * Disk >= 50 GB * Docker >= 24 * Docker Compose >= 2.26 演示环境里使用的是: * Ubuntu 22.04 *...











