AI 与智能体-AI运维探索者-第4页

更新

浏览

Coze+Ansible实战：插件、工作流与自动化运维智能体

一、创建coze插件工具： exec_playbook 代码依赖包元数据：测试： 1.1 创建coze工作流需要提前创建一个智能体，并定义用户变量ANSIBLE_API_TOKEN 试运行发布 1.2 配置coze智能体前面已经...

# 智能体 # 工作流编排 # 工具调用

10个月前

05015

Kubernetes管理GPU和大模型技术体系

一、K8s管理GPU资源技术架构 k8s默认不支持管理GPU 安装完英伟达驱动后支持管理GPU 二、K8s管理大模型服务方案针对vLLM serve、Ollama serve等各类大模型服务，可以使用资源类型为Deployment进...

# Kubernetes # 工程实践 # 大模型工程

9个月前

04515

如何获取并制作大模型微调数据集

一、从 Hugging Face 获取公共数据集地址： `https://huggingface.co/datasets` 1.1 安装命令行工具默认前提是机器已经装好 Python 和 pip。 1.2 获取 Token 注册、登录并验证邮箱后，可以在...

# 工程实践 # 大模型工程 # 模型部署

8个月前

04013

Dify+Elasticsearch MCP：搜索与日志运维智能体

一、准备ElasticSearch环境服务器：Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码访问 1.7 基础操作创建索引假设我们要创...

# 智能体 # Elasticsearch # 工具调用

4个月前

0546

n8n 入门与部署：什么是 n8n，如何用 Docker 跑起来

一、什么是 n8n n8n 是一款开源、可自托管、可视化的工作流自动化平台。你可以把它理解成一个“节点式自动化引擎”，通过拖拽节点把不同服务串起来，完成定时任务、数据同步、消息通知和 AI 自...

# Docker # 工作流编排 # 智能体平台

9个月前

0476

vLLM 集群模式部署：Ray、多机多卡与远程访问

一、先准备机器示例建议： * 优先使用阿里云。 * GPU 选 A10 或更高等级。 * 不建议选 T4，这类卡在大模型集群场景下通常偏弱。二、部署前准备 2.1 安装驱动和 CUDA 所有机器都要完成这一步。...

# 工程实践 # 大模型工程 # 模型部署

8个月前

06113

Claude Code 与 Codex：命令行 AI 编程助手实战

一、Claude Code 是什么 Claude Code 是 Anthropic 推出的终端原生 AI 编程助手，核心特点是：直接运行在命令行里；更适合复杂任务、多步骤修改和大型代码库理解；能把自然语言指令转成实际...

# AI编程 # Agent # Codex

4个月前

0569

OpenClaw Skills入门：为什么需要Skills、怎么自定义、如何用ClawHub

一、OpenClaw Skills 是什么 OpenClaw Skills,本质上是给Agent配的“专项能力包”。它不是模型本身,而是让模型在特定任务里“按固定方法做事“的一层标准化机制。二、为什么需要 Skills 很多...

# 智能体 # OpenClaw # AI 自动化

3个月前

0659

Milvus Python 实战：创建集合、插入数据、搜索与更新

一、先安装 Python 客户端这里最好让 `pymilvus` 版本和 Milvus 服务版本尽量对应。二、连接到 Milvus 最基础的连接方式如下：三、创建集合示例里使用的是 8 维向量，便于演示。核心步骤包...

# RAG # 知识库 # 检索增强生成

10个月前

04715

大模型推理优化总览：硬件、系统架构与服务部署

一、大模型优化的核心目标优化通常围绕四个目标展开： * 降低延迟： * 尤其是首个 Token 时间和生成速度。 * 提高吞吐： * 在固定资源下服务更多请求。 * 降低成本： * 提升资源利用率，降低单...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0516

上一页 1 2 345 6…11 下一页跳转