最新发布第17页
大模型为什么离不开 GPU-AI运维探索者

大模型为什么离不开 GPU

一、为什么大模型依赖 GPU 大模型(如GPT、DeepSeek等)依赖GPU进行训练和推理 CPU和GPU的区别: | | CPU | GPU | | -------------------------- | --------------------------------------------...
用 EvalScope 压测 Qwen3-8B:从环境准备到指标解读-AI运维探索者

用 EvalScope 压测 Qwen3-8B:从环境准备到指标解读

一、压测对象 这份实战使用的是硅基流动提供的免费 `Qwen3-8B` 服务。 模型入口示意: 获取 API Key 的流程同样在平台控制台中完成。 公开文档里只建议写成: * `SILICONFLOW_API_KEY=` 二、准...
Filebeat日志采集方案:非云原生应用与系统组件日志收集-AI运维探索者

Filebeat日志采集方案:非云原生应用与系统组件日志收集

一、非云原生应用日志收集方案 1.1 Filebeat收集非云原生应用日志架构图 1.1 Filebeat收集非云原生应用日志架构图解析 1、**应用与日志生成** - **非云原生应用(Application)** 以容器形式运...
Coze自定义插件入门:基于API和IDE创建插件-AI运维探索者

Coze自定义插件入门:基于API和IDE创建插件

一、基于 API 创建 Coze 自定义插件 1、先搞定API资源网站 测试站点:https://www.tianapi.com 注册账户 点击首页https://www.tianapi.com/ 找到“渣男语录” 点击进去,然后点“申请接口” 点...
Redis 缓存穿透、击穿、雪崩与双写一致性-AI运维探索者

Redis 缓存穿透、击穿、雪崩与双写一致性

一、Redis应用问题解决 ① 缓存穿透:大量请求根本不存在的 key ② 缓存雪崩: redis中大量 key集体过期 ③ 缓存击穿: redis中一个热点 key过期(大量用户访问该热点 key,但是热点 key过期) ...
Nginx location进阶:正则匹配、浏览器缓存与优先级详解-AI运维探索者

Nginx location进阶:正则匹配、浏览器缓存与优先级详解

一、为什么 `location` 还需要进阶规则 基础场景里,`location /` 或 `location /admin/` 已经能解决很多问题。 但一旦网站内容变多,就会出现新的需求: - 让不同后缀的资源走不同规则 - 给静...
OpenClaw接入飞书:应用创建、Channel配置与测试-AI运维探索者

OpenClaw接入飞书:应用创建、Channel配置与测试

一、在飞书开放平台创建企业自建应用 访问https://open.feishu.cn/app?lang=zhCN,点击“创建企业自建应用” 定义“应用名称”、“应用描述” 添加机器人 权限管理 另外还需要开启“contact:con...
Kubernetes存储:API资源对象StorageClass-AI运维探索者

Kubernetes存储:API资源对象StorageClass

一、下载源码 二、修改命名空间为kube-system并创建rbac授权 查看创建情况 三、修改并应用deployment.yaml 修改命名空间为kube-system 修改nfs服务器地址、nfs共享目录和镜像地址 应用deploymen...
Istio可观测实践-AI运维探索者

Istio可观测实践

一、环境准备 1、下载环境资源yaml 2、部署Prometheus、Grafana、kiali、Jaeger 检测 3、设置Kiali登录的用户名和密码 说明:用户名和密码都是admin 4、配置各组件对外访问 (1)kiali对外端口为1...
大模型运维监控入门:命令行工具、Prometheus 与 Grafana-AI运维探索者

大模型运维监控入门:命令行工具、Prometheus 与 Grafana

一、先用命令行工具做最小监控 1.1 NVIDIA GPU:`nvidia-smi` 这是最基础也最常用的 NVIDIA GPU 监控工具,前提是已经安装好显卡驱动。 常见用法: 它最适合做: * 快速排查显存占用; * 看当前...