AI 与智能体共107篇
Dify+k8s运维智能体:部署MCP并创建Kubernetes Agent-AI运维探索者

Dify+k8s运维智能体:部署MCP并创建Kubernetes Agent

一、部署python版本的mcp 项目地址:https://pypi.org/project/mcpkubernetesserver 该项目已经纳入pip的仓库了,可以直接使用pip install安装,非常方便。 该mcp提供了非常多的工具 1.1 命令行...
开源版 Coze 私有部署实战:用 Docker 跑起 Coze Studio-AI运维探索者

开源版 Coze 私有部署实战:用 Docker 跑起 Coze Studio

一、先准备机器 一个入门级实验环境就够了: * CPU:2C * 内存:4G * 磁盘:40G * 系统:Ubuntu 22.04 如果你只是做实验,使用云上的抢占式实例会更省钱,用完及时销毁即可。 二、安装 Docker ...
大模型压测入门:核心指标与常见压测工具-AI运维探索者

大模型压测入门:核心指标与常见压测工具

一、大模型压测为什么特别重要 相比传统 API,大模型服务的性能不只是“请求快不快”,还涉及: * 首个 Token 出来的速度; * 后续 Token 生成的节奏; * 并发下吞吐是否塌陷; * GPU 利用率是...
用AI生成PRD并落地开发:从需求文档到项目实现-AI运维探索者

用AI生成PRD并落地开发:从需求文档到项目实现

一、先让 AI 生成需求文档 这是最推荐的起点,因为它能把你脑子里的模糊想法先整理成结构化文档。 1.1 企业官网 PRD 示例 例如可以直接给出这样的需求: 1.2 AI 原生应用 PRD 示例 如果你要做一...
OpenClaw接入飞书:应用创建、Channel配置与测试-AI运维探索者

OpenClaw接入飞书:应用创建、Channel配置与测试

一、在飞书开放平台创建企业自建应用 访问https://open.feishu.cn/app?lang=zhCN,点击“创建企业自建应用” 定义“应用名称”、“应用描述” 添加机器人 权限管理 另外还需要开启“contact:con...
RAGFlow 入门:它的特点、适用场景,以及和 FastGPT 的区别-AI运维探索者

RAGFlow 入门:它的特点、适用场景,以及和 FastGPT 的区别

一、RAGFlow 是什么 RAGFlow 是一个基于深度文档理解的开源 RAG 引擎,目标是为企业提供更高质量的知识检索与问答能力。 官网: `https://ragflow.io/` GitHub: `https://github.com/infiniflo...
大模型私有化部署硬件选型策略与企业案例-AI运维探索者

大模型私有化部署硬件选型策略与企业案例

- 一、先按需求驱动做决策 - 1.1 数据安全与合规性优先 适用场景 * 金融、医疗、政府等需要遵守数据安全与个人信息保护要求的行业。 * 涉及国家机密,或者跨境数据传输受限的企业。 硬件选型要...
Dify 进阶实战:配置模型、插件与应用编排-AI运维探索者

Dify 进阶实战:配置模型、插件与应用编排

一、在 Dify 中配置模型 进入右上角头像的设置页,找到“模型供应商”。 安装并配置目标模型供应商后,就可以把自己的 API Key 填进去。 这里建议直接使用占位方式记录: * `DEEPSEEK_API_KEY=`...
Ollama 私有化部署实战:云主机、模型运行与 OpenWebUI-AI运维探索者

Ollama 私有化部署实战:云主机、模型运行与 OpenWebUI

一、先准备云主机 1.1 AutoDL AutoDL 官网: `https://autodl.com/home` 它的优势通常是便宜、按量付费、适合做实验,但因为是容器化虚拟机,性能体验可能略差一些。 1.2 阿里云 / 腾讯云 GPU ...
用 DistillKit 做大模型蒸馏:Qwen3-8B 到 Qwen3-0.6B-AI运维探索者

用 DistillKit 做大模型蒸馏:Qwen3-8B 到 Qwen3-0.6B

一、DistillKit 是什么 DistillKit 是 Arcee.AI 开源的大模型蒸馏工具包,目标是让研究和工程团队更容易实践多种蒸馏方法。 它支持的主要方向包括: * 基于 logits 的蒸馏; * 基于隐藏状态的蒸...