排序
AI克隆网站实战:从v0生成原型到二次开发
一、v0 是什么 v0.app 是 Vercel 推出的 AI 驱动建站工具,强调从自然语言描述快速生成 Web 应用原型或可部署前端。 类似工具还有: https://same.new/ 这类工具的共同优势是:能极快把“想法”...
大模型推理优化总览:硬件、系统架构与服务部署
一、大模型优化的核心目标 优化通常围绕四个目标展开: * 降低延迟: * 尤其是首个 Token 时间和生成速度。 * 提高吞吐: * 在固定资源下服务更多请求。 * 降低成本: * 提升资源利用率,降低单...
Coze自定义插件入门:基于API和IDE创建插件
一、基于 API 创建 Coze 自定义插件 1、先搞定API资源网站 测试站点:https://www.tianapi.com 注册账户 点击首页https://www.tianapi.com/ 找到“渣男语录” 点击进去,然后点“申请接口” 点...
大模型为什么离不开 GPU
一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别: | | CPU | GPU | | -------------------------- | --------------------------------------------...
Dify+k8s运维智能体:部署MCP并创建Kubernetes Agent
一、部署python版本的mcp 项目地址:https://pypi.org/project/mcpkubernetesserver 该项目已经纳入pip的仓库了,可以直接使用pip install安装,非常方便。 该mcp提供了非常多的工具 1.1 命令行...
大模型行业选型建议:金融、医疗、制造与教育
一、金融行业 | 细分领域 | 核心要求 | 推荐模型 | 关键能力 | | ---------- | ------------------------ | --------------- | ------------------------------ | | 投研、分析 | 招股书解析、...
Dify+Zabbix MCP:监控平台智能体落地
一、部署zabbix环境 准备两台机器分别部署zabbixserver和zabbixagent,其中机器和版本信息:Zabbix 6.0、Rocky9、数据库使用MariaDB、Web环境使用PHP+Apache 1.1 准备工作(两台都执行) 关闭Se...
OpenClaw部署实战:云主机、本地虚拟机与基础安装
一、OpenClaw 部署方式概览 1.1 云主机部署 由于OpenClaw非常火爆,越来越多的云平台(腾讯云、阿里云、百度云、火山引擎)支持一键部署 1.2 腾讯云一键部署 OpenClaw 官方教程:https://cloud.tenc...
RAGFlow 项目实战:做一个公司内部员工智能问答助手
一、项目目标 这个项目的目标是: * 把员工手册和培训手册导入 RAGFlow; * 做一个公司内部知识问答助手; * 再把它嵌入 OA 或企业内部页面。 二、准备知识文档 如果你没有现成资料,可以先用生...
Dify+Elasticsearch MCP:搜索与日志运维智能体
一、准备ElasticSearch环境 服务器:Rocky9 2C4G 1.1 配置yum仓库 1.2 dnf安装es 1.3 修改配置 1.4 设置主机名 1.5 启动服务 1.6 设置elastic用户密码 访问 1.7 基础操作 创建索引 假设我们要创...









