排序
RAGFlow 入门:它的特点、适用场景,以及和 FastGPT 的区别
一、RAGFlow 是什么 RAGFlow 是一个基于深度文档理解的开源 RAG 引擎,目标是为企业提供更高质量的知识检索与问答能力。 官网: `https://ragflow.io/` GitHub: `https://github.com/infiniflo...
大模型私有化部署硬件选型策略与企业案例
- 一、先按需求驱动做决策 - 1.1 数据安全与合规性优先 适用场景 * 金融、医疗、政府等需要遵守数据安全与个人信息保护要求的行业。 * 涉及国家机密,或者跨境数据传输受限的企业。 硬件选型要...
Dify+Prometheus MCP:告警体系与AIOps智能体
一、环境准备 说明:安装Prometheus+alertmanager的机器配置如下 CPU:2C 内存:4G 磁盘:40G 系统:Rocky9 1.1 安装Prometheus 下载包 如果该链接无法下载,可以使用代理 解压 编辑systemd脚本...
大模型行业选型建议:法律、能源、农业与文旅
一、法律行业 | 细分领域 | 核心要求 | 推荐模型 | 关键能力 | | -------- | ---------------------- | --------------------- | ---------------------------- | | 合同审查 | 条款风险识别、...
Coze+Ansible实战:环境准备、API服务与Playbook
一、准备 Ansible 环境 1、准备两台机器,机器配置无需太高,比如1c2g,这里建议大家使用阿里云按量付费机器。 2、安装Ansible 两台机器都执行 说明:以下命令为阿里云alibaba cloud linux系统 ...
大模型私有化部署前,如何估算硬件配置
- 一、硬件核心配置逻辑 - 1.1 GPU 选型原则 * 显存容量:每 10 亿参数(1B)大约需要 1-2GB 显存,例如 70B 模型通常需要 80GB 级别显存,常见推荐是 A100 或 H100。 * 计算能力:优先选择 FP1...
Transformer 编码器与解码器:一篇看懂核心结构
一、先看 Transformer 的整体结构 架构图: 示例:输入:'The cat sat on the mat'--->输出:'猫坐在垫子上' **输入阶段:** * 1)词嵌入(Word Embedding) * 将每个单词转换为512维向量,例如: *...
FastGPT 项目实战:做一个公司内部员工智能问答助手
一、项目目标 目标是做一个公司内部员工智能问答助手,能够基于以下资料回答问题: * 员工手册; * 各部门培训手册; * 技术部内部资源使用说明。 最终可以把这个助手发布到公司内部 OA 或门户...
OpenClaw多Agent实战:组织架构、飞书应用与Agent配置
一、规划 OpenClaw 多 Agent 组织架构 思路: 基于多个飞书机器人应用实现,OpenClaw一个主Agent,多个子Agent,每个Agent都有单独的一个workspace,每个飞书机器人对应一个Agent 1.1 设计组织...
开源版 Coze 私有部署实战:用 Docker 跑起 Coze Studio
一、先准备机器 一个入门级实验环境就够了: * CPU:2C * 内存:4G * 磁盘:40G * 系统:Ubuntu 22.04 如果你只是做实验,使用云上的抢占式实例会更省钱,用完及时销毁即可。 二、安装 Docker ...










