最新发布第43页
Kubernetes特殊资源保留实战:把GPU节点留给真正需要的工作负载-AI运维探索者

Kubernetes特殊资源保留实战:把GPU节点留给真正需要的工作负载

一、K8s节点特殊资源保留 当 Kubernetes 中存储特殊节点时,应该尽量保持不要特殊资源的 Pod 不要调度到这些节点上,此时可以通过污点进行控制。 假如包含了GPU的节点不能被任意调度 具有其它特...
PostgreSQL 逻辑结构入门:集簇、数据库、模式与表空间-AI运维探索者

PostgreSQL 逻辑结构入门:集簇、数据库、模式与表空间

一、逻辑结构 1.1 数据库集簇逻辑结构 1.2 数据库集群-Database cluster 也叫数据库集簇。它是指有单个PostgreSQL服务器实例管理的数据库集合,组成数据库集群的这些数据库使 用相同的全局配置...
LNMP数据库准备:MariaDB安装、安全初始化与授权访问-AI运维探索者

LNMP数据库准备:MariaDB安装、安全初始化与授权访问

一、为什么 LNMP 需要先准备数据库 对于 WordPress 这类动态网站来说,页面内容、用户信息、文章数据都不可能只靠静态文件保存。 因此在 LNMP 中,数据库是动态站点上线前必须先准备好的基础组...
Prometheus 部署实战:在 Kubernetes 中搭建监控平台-AI运维探索者

Prometheus 部署实战:在 Kubernetes 中搭建监控平台

一、部署配置 整个监控体系涉及的技术栈较多,几乎可覆盖真实企业中的所有场景。主要技术栈如下: - Prometheus:监控主服务 - node-exporter:数据采集器 - kube-state-metrics:数据采集器 - ...
MongoDB 副本集的选举-AI运维探索者

MongoDB 副本集的选举

一、影响选举的因素 整个集群必须有大多数节点存活;被选举为主节点的节点必须: - 能够与多数节点建立连接 - 具有较新的 oplog - 具有较高的优先级(如果有配置) 二、选举的机制: Bully算法 mongo...
Kubernetes 中部署 MinIO:Operator、Tenant 与验证流程-AI运维探索者

Kubernetes 中部署 MinIO:Operator、Tenant 与验证流程

一、概述 MinIO 作为高性能对象存储,是与 Amazon S3 云存储服务兼容的 API,使用 MinIO 为机器学习、分析 和应用程序数据工作负载构建高性能基础架构。 对于 Kubernetes 环境,使用 MinIO Oper...
Dify+Ansible运维智能体:部署MCP并创建Agent-AI运维探索者

Dify+Ansible运维智能体:部署MCP并创建Agent

一、准备Ansible环境 如果你的电脑内存足够大(不少32G),可以开虚拟机做此部分使用,否则需要到阿里云购买按量付费的抢占式实例,实验完及时销毁,以免产生费用。 配置建议: CPU:2C 内存:4...
RBAC企业实践-AI运维探索者

RBAC企业实践

一、创建通用权限 1.1 创建通用权限-list 1.2 创建通用权限-delete 1.3 创建通用权限-exec 1.4 创建通用权限-log 二、创建用户管理命名空间 三、创建用户 四、获取两个用户的token 4.1 获取user...
去 Eureka 化改造:修改 receive 与 handler 的配置文件-AI运维探索者

去 Eureka 化改造:修改 receive 与 handler 的配置文件

一、重新修改代码配置文件 1、修改demo-receive的代码配置文件 原本demo-receive的代码配置文件 新增demo-receive的代码配置文件 2、修改demo-handler的代码配置文件 原本demo-handler的代码配...
Jenkins 流水线优化:并行、缓存与阶段裁剪-AI运维探索者

Jenkins 流水线优化:并行、缓存与阶段裁剪

一、优化交付流水线性能 随着交付流水线的复杂度越来越高,需要优化交付流水线的性能成为了一个时刻需要关注的问题。 下面是一些常见的优化策略: 1.1 并行执行 使用并行执行可以大大缩短交付流...