排序
Dify+Jumpserver实战:资产管理工作流与综合型应用
一、创建 Dify 资产管理应用 目标:通过自然语言来添加资产(主机) 1、创建空白应用、工作流模式 2、开始节点,添加变量input 3、添加获取当前时间节点 因为后面添加主机时,需要当前时间戳 4...
Unsloth 微调 Qwen3-4B 实战:训练、推理与 vLLM 部署
一、先配置训练器 示例里使用的是 `SFTTrainer`: - 二、几个关键超参数怎么理解 * `gradient_accumulation_steps`: * 用梯度累积模拟更大的 batch。 * `warmup_steps`: * 训练初期逐步升高学...
Kubernetes管理大模型实战
一、K8s使用Model资源部署大模型 1、在 K8s 上部署大模型,可以直接用 Ollama Operator 的 CRD Model 部署,比如部署一个 phi的模型 2、首次部署大模型,会先创建一个 store 服务,用于存储 oll...
大模型为什么离不开 GPU
一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别: | | CPU | GPU | | -------------------------- | --------------------------------------------...
Transformer 为什么成为大模型核心架构
一、Transformer 解决了什么问题 传统模型(RNN/LSTM) * 痛点:无法并行处理、长距离依赖失效、上下文理解局限 * 举例:传话游戏,只能一传一,不能互相通信,第1个人接收到的信息跟第10个人比肯定会...
RAGFlow 项目实战:做一个公司内部员工智能问答助手
一、项目目标 这个项目的目标是: * 把员工手册和培训手册导入 RAGFlow; * 做一个公司内部知识问答助手; * 再把它嵌入 OA 或企业内部页面。 二、准备知识文档 如果你没有现成资料,可以先用生...
FastGPT 入门与安装:功能定位、应用场景和 Docker 部署
一、FastGPT 是什么 FastGPT 是一个基于大语言模型的开源知识库问答系统,目标是帮助用户快速构建专属 AI 助手,尤其适合企业内部文档问答和复杂知识检索场景。 二、FastGPT 的核心能力 2.1 知...
Dify+k8s运维智能体:单机Kubernetes部署
一、部署单机 Kubernetes 前的准备工作 为了节省成本,这里我们可以部署一台单机版的k8s 机器配置建议:CUP:2c, 内存:4G, 磁盘:40G 1、关闭防火墙firewalld、selinux 2、设置主机名 设置/e...
大模型微调数据集入门:常见分类与数据格式
一、什么是大模型微调数据集 简单说,微调数据集就是一批专门为某个目标准备的数据,用来让一个已经很强的通用模型,进一步学会特定任务、特定风格或特定领域知识。 二、常见数据集分类 2.1 指...
Dify+Elasticsearch MCP:搜索与日志运维智能体
一、准备ElasticSearch环境 服务器:Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码 访问 1.7 基础操作 创建索引 假设我们要创...











