最新发布第112页
PrometheusAlert 部署实战:控制器部署与模板管理-AI运维探索者

PrometheusAlert 部署实战:控制器部署与模板管理

一、部署PrometheusAlert **获取企业微信机器人webhook的key值** * https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=9d8866d6-ab55-48f3-8336-786325667640 **为防止模版数据丢失,增加...
MongoDB mongos 连接数异常-AI运维探索者

MongoDB mongos 连接数异常

一、背景 在 sharding 集群中,我们发现 MongoDB ops 异常,但数据库的负载压力并不高,经过检查发现 mongos 连接数异常引发的后端 ops 异常抖动。 二、日志信息 日志中能够看到,越来越多的连接不...
Containerd配置实战:insecure registry、命名空间与Kubernetes镜像引用-AI运维探索者

Containerd配置实战:insecure registry、命名空间与Kubernetes镜像引用

一、为什么要配置 insecure registry 当你在学习环境或内网环境中使用不带正式证书的 Harbor 或其他 HTTP 仓库时,Containerd 默认不会直接信任它。 这时就需要在 Containerd 配置中显式告诉运...
声明式API与Serverless实战认知:云原生架构设计关键能力-AI运维探索者

声明式API与Serverless实战认知:云原生架构设计关键能力

一、为什么声明式 API 是云原生的重要基础 声明式 API 是一种比较流行且先进的编程范式,它强调通过声明的方式表达目标状态,而不是手工描述每一步操作过程。 这种模式的关键价值在于把“我想要...
Istio:基于http的流量控制-AI运维探索者

Istio:基于http的流量控制

一、基于user-agent。 1.1 更改forecast的路由规则 1.2 查看规则 说明:浏览器user-agnet包含chrome关键词的会被转发到v2,其它浏览器会被转发到v1 - 1.3 打开chrome浏览器输入http://192.168.1...
什么是 Kubernetes Job:工作流程、特点、场景与基础认知-AI运维探索者

什么是 Kubernetes Job:工作流程、特点、场景与基础认知

一、什么是Job Job 会创建一个或者多个 Pod,并将继续重试 Pod 的执行,直到指定数量的 Pod 成功终止。 随着 Pod 成功结束,Job 跟踪记录成功完成的 Pod 个数。 当数量达到指定的成功个数阈值时...
Linux文本处理进阶:wc、sort与uniq的巧妙结合-AI运维探索者

Linux文本处理进阶:wc、sort与uniq的巧妙结合

一、wc 统计 word count/calcuate 统计文件中单词情况,大小,行数, 未来工作中用于统计行数 简单使用是统计文件的行数,未来还可以统计一些命令的结果有多少行(个). | wc选项 | 说明 | | -----...
Kubernetes存储:API资源对象PV和PVC-AI运维探索者

Kubernetes存储:API资源对象PV和PVC

一、PV PV YAML示例 说明: * storageClassName: 定义存储类名称,PV和PVC中都会有该字段,目的是为了方便两者匹配绑定在一起 * accessModes定义该pv的访问权限模式,有三种: * ReadWriteOnce...
Vercel部署实战:从导入GitHub到绑定域名-AI运维探索者

Vercel部署实战:从导入GitHub到绑定域名

一、先准备 Vercel 账号 访问:https://vercel.com/ 通常可以直接使用 GitHub 账号登录。 二、导入 GitHub 项目 进入 Vercel 后,新建项目,然后选择导入 GitHub 仓库。 三、配置环境变量 如果...
大模型压测入门:核心指标与常见压测工具-AI运维探索者

大模型压测入门:核心指标与常见压测工具

一、大模型压测为什么特别重要 相比传统 API,大模型服务的性能不只是“请求快不快”,还涉及: * 首个 Token 出来的速度; * 后续 Token 生成的节奏; * 并发下吞吐是否塌陷; * GPU 利用率是...