AI 与智能体 第4页
Coze+Ansible实战:插件、工作流与自动化运维智能体-AI运维探索者

Coze+Ansible实战:插件、工作流与自动化运维智能体

一、创建coze插件 工具: exec_playbook 代码 依赖包 元数据: 测试: 1.1 创建coze工作流 需要提前创建一个智能体,并定义用户变量ANSIBLE_API_TOKEN 试运行 发布 1.2 配置coze智能体 前面已经...
Kubernetes管理GPU和大模型技术体系-AI运维探索者

Kubernetes管理GPU和大模型技术体系

一、K8s管理GPU资源技术架构 k8s默认不支持管理GPU 安装完英伟达驱动后支持管理GPU 二、K8s管理大模型服务方案 针对vLLM serve、Ollama serve等各类大模型服务,可以使用资源类型为Deployment进...
如何获取并制作大模型微调数据集-AI运维探索者

如何获取并制作大模型微调数据集

一、从 Hugging Face 获取公共数据集 地址: `https://huggingface.co/datasets` 1.1 安装命令行工具 默认前提是机器已经装好 Python 和 pip。 1.2 获取 Token 注册、登录并验证邮箱后,可以在...
Dify+Elasticsearch MCP:搜索与日志运维智能体-AI运维探索者

Dify+Elasticsearch MCP:搜索与日志运维智能体

一、准备ElasticSearch环境 服务器:Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码 访问 1.7 基础操作 创建索引 假设我们要创...
n8n 入门与部署:什么是 n8n,如何用 Docker 跑起来-AI运维探索者

n8n 入门与部署:什么是 n8n,如何用 Docker 跑起来

一、什么是 n8n n8n 是一款开源、可自托管、可视化的工作流自动化平台。你可以把它理解成一个“节点式自动化引擎”,通过拖拽节点把不同服务串起来,完成定时任务、数据同步、消息通知和 AI 自...
vLLM 集群模式部署:Ray、多机多卡与远程访问-AI运维探索者

vLLM 集群模式部署:Ray、多机多卡与远程访问

一、先准备机器 示例建议: * 优先使用阿里云。 * GPU 选 A10 或更高等级。 * 不建议选 T4,这类卡在大模型集群场景下通常偏弱。 二、部署前准备 2.1 安装驱动和 CUDA 所有机器都要完成这一步。...
Claude Code 与 Codex:命令行 AI 编程助手实战-AI运维探索者

Claude Code 与 Codex:命令行 AI 编程助手实战

一、Claude Code 是什么 Claude Code 是 Anthropic 推出的终端原生 AI 编程助手,核心特点是: 直接运行在命令行里; 更适合复杂任务、多步骤修改和大型代码库理解; 能把自然语言指令转成实际...
OpenClaw Skills入门:为什么需要Skills、怎么自定义、如何用ClawHub-AI运维探索者

OpenClaw Skills入门:为什么需要Skills、怎么自定义、如何用ClawHub

一、OpenClaw Skills 是什么 OpenClaw Skills,本质上是给Agent配的“专项能力包”。 它不是模型本身,而是让模型在特定任务里“按固定方法做事“的一层标准化机制。 二、为什么需要 Skills 很多...
Milvus Python 实战:创建集合、插入数据、搜索与更新-AI运维探索者

Milvus Python 实战:创建集合、插入数据、搜索与更新

一、先安装 Python 客户端 这里最好让 `pymilvus` 版本和 Milvus 服务版本尽量对应。 二、连接到 Milvus 最基础的连接方式如下: 三、创建集合 示例里使用的是 8 维向量,便于演示。 核心步骤包...
大模型推理优化总览:硬件、系统架构与服务部署-AI运维探索者

大模型推理优化总览:硬件、系统架构与服务部署

一、大模型优化的核心目标 优化通常围绕四个目标展开: * 降低延迟: * 尤其是首个 Token 时间和生成速度。 * 提高吞吐: * 在固定资源下服务更多请求。 * 降低成本: * 提升资源利用率,降低单...