AI 与智能体-AI运维探索者-第9页

Unsloth 微调 Qwen3-4B 实战：训练、推理与 vLLM 部署

一、先配置训练器示例里使用的是 `SFTTrainer`： - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`： * 用梯度累积模拟更大的 batch。 * `warmup_steps`： * 训练初期逐步升高学...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0297

Kubernetes管理大模型实战

一、K8s使用Model资源部署大模型 1、在 K8s 上部署大模型，可以直接用 Ollama Operator 的 CRD Model 部署，比如部署一个 phi的模型 2、首次部署大模型，会先创建一个 store 服务，用于存储 oll...

# Kubernetes # 工程实践 # 大模型工程

9个月前

0337

大模型为什么离不开 GPU

一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别： | | CPU | GPU | | -------------------------- | --------------------------------------------...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0537

Transformer 为什么成为大模型核心架构

一、Transformer 解决了什么问题传统模型(RNN/LSTM) * 痛点:无法并行处理、长距离依赖失效、上下文理解局限 * 举例:传话游戏,只能一传一,不能互相通信,第1个人接收到的信息跟第10个人比肯定会...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0267

RAGFlow 项目实战：做一个公司内部员工智能问答助手

一、项目目标这个项目的目标是： * 把员工手册和培训手册导入 RAGFlow； * 做一个公司内部知识问答助手； * 再把它嵌入 OA 或企业内部页面。二、准备知识文档如果你没有现成资料，可以先用生...

# RAG # 知识库 # 检索增强生成

10个月前

0517

Dify+Jumpserver实战：资产管理工作流与综合型应用

一、创建 Dify 资产管理应用目标：通过自然语言来添加资产（主机） 1、创建空白应用、工作流模式 2、开始节点，添加变量input 3、添加获取当前时间节点因为后面添加主机时，需要当前时间戳 4...

# 工作流编排 # 智能体平台 # 自动化

9个月前

0527

FastGPT 入门与安装：功能定位、应用场景和 Docker 部署

一、FastGPT 是什么 FastGPT 是一个基于大语言模型的开源知识库问答系统，目标是帮助用户快速构建专属 AI 助手，尤其适合企业内部文档问答和复杂知识检索场景。二、FastGPT 的核心能力 2.1 知...

# RAG # 知识库 # 检索增强生成

10个月前

0476

Dify+k8s运维智能体：单机Kubernetes部署

一、部署单机 Kubernetes 前的准备工作为了节省成本，这里我们可以部署一台单机版的k8s 机器配置建议：CUP：2c，内存：4G，磁盘：40G 1、关闭防火墙firewalld、selinux 2、设置主机名设置/e...

# 工作流编排 # 智能体平台 # 自动化

9个月前

0396

大模型微调数据集入门：常见分类与数据格式

一、什么是大模型微调数据集简单说，微调数据集就是一批专门为某个目标准备的数据，用来让一个已经很强的通用模型，进一步学会特定任务、特定风格或特定领域知识。二、常见数据集分类 2.1 指...

# 工程实践 # 大模型工程 # 模型部署

8个月前

0436

Dify+Elasticsearch MCP：搜索与日志运维智能体

一、准备ElasticSearch环境服务器：Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码访问 1.7 基础操作创建索引假设我们要创...

# 智能体 # Elasticsearch # 工具调用

4个月前

0546

上一页 1…7 8910 11 下一页跳转