最新发布第29页
RBAC企业实践-AI运维探索者

RBAC企业实践

一、创建通用权限 1.1 创建通用权限-list 1.2 创建通用权限-delete 1.3 创建通用权限-exec 1.4 创建通用权限-log 二、创建用户管理命名空间 三、创建用户 四、获取两个用户的token 4.1 获取user...
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
华为设备本地AAA认证配置实验:域、认证方案与远程登录授权-AI运维探索者

华为设备本地AAA认证配置实验:域、认证方案与远程登录授权

一、**实验拓扑** 二、**实验说明** 1、R2作为认证方,R1作为被认证方。 三、**实验需求** 1、R1可以通过远程登录到R2 2、远程登录认证方式为aaa 3、创建域名为HCIA-Datacom的域,并且绑定名为H...
Skywalking:准备工作与版本信息-AI运维探索者

Skywalking:准备工作与版本信息

一、版本信息 Kubernetes 1.26.2 Skywalking 9.5.0 Elasticsearch 8.8.1
vLLM 集群模式部署:Ray、多机多卡与远程访问-AI运维探索者

vLLM 集群模式部署:Ray、多机多卡与远程访问

一、先准备机器 示例建议: * 优先使用阿里云。 * GPU 选 A10 或更高等级。 * 不建议选 T4,这类卡在大模型集群场景下通常偏弱。 二、部署前准备 2.1 安装驱动和 CUDA 所有机器都要完成这一步。...
MongoDB 其他常见案例解决-AI运维探索者

MongoDB 其他常见案例解决

一、高峰时段 chunk 迁移导致磁盘读写性能抖动,业务响应超时。 解决:配置迁移窗口时间,避免白天操作影响业务 //如下操作则设置了只在凌晨 2 点 -6 点工作 二、由于 mongo 客户端与 server 版本...
PostgreSQL Standby 高可用搭建:异步、同步与级联复制-AI运维探索者

PostgreSQL Standby 高可用搭建:异步、同步与级联复制

一、pg standby的原理 利用主库产生的wal文件,通过流复制方式,存在一个与主库同步的在线备数据库服务器, - 当主数据库服务器失败后,备数据库服务器可以快速提升为主服务器并提供服务,从而...
Jenkins 流水线优化:并行、缓存与阶段裁剪-AI运维探索者

Jenkins 流水线优化:并行、缓存与阶段裁剪

一、优化交付流水线性能 随着交付流水线的复杂度越来越高,需要优化交付流水线的性能成为了一个时刻需要关注的问题。 下面是一些常见的优化策略: 1.1 并行执行 使用并行执行可以大大缩短交付流...
Istio:HTTP重定向和重写(针对VirtualService)-AI运维探索者

Istio:HTTP重定向和重写(针对VirtualService)

一、redirect(重定向) 1、配置规则 2、查看规则 说明:将/ad 重定向到 /mantenanced 3、测试 二、rewrite(重写) 1、配置规则 2、查看规则 3、测试 4、对比效果,把advertisement-route这条...
Kubernetes基础:Deployment-AI运维探索者

Kubernetes基础:Deployment

一、创建YAML文件 二、使用YAML创建deploy 三、查看 四、查看pod分配到哪个节点上 五、恢复