最新发布第20页
MongoDB mongos 连接数异常-AI运维探索者

MongoDB mongos 连接数异常

一、背景 在 sharding 集群中,我们发现 MongoDB ops 异常,但数据库的负载压力并不高,经过检查发现 mongos 连接数异常引发的后端 ops 异常抖动。 二、日志信息 日志中能够看到,越来越多的连接不...
Docker数据持久化-AI运维探索者

Docker数据持久化

一、将本地目录映射到容器里。 上面参数说明: * -v:用来指定挂载目录 * :前面的/data/为宿主机本地目录 * :后面的/data/为容器里的目录,会在容器中自动创建 在宿主机的/data/目录里创建一个...
Kubernetes节点故障后如何快速恢复服务:污点、驱逐与重新调度-AI运维探索者

Kubernetes节点故障后如何快速恢复服务:污点、驱逐与重新调度

一、问题一:节点故障如何快速恢复服务? 在 Kubernetes 集群中,当某个节点发生故障时,通过以下机制快速恢复服务: 1、节点故障检测 - **节点控制器(Node Controller)** 定期检查节点状态(...
Prometheus静态配置监控Windows主机实战-AI运维探索者

Prometheus静态配置监控Windows主机实战

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
Jenkins + GitLab SSO:授权认证与异常修复-AI运维探索者

Jenkins + GitLab SSO:授权认证与异常修复

一、Jenkins 平台基于 GitLab 的 SSO 授权认证 为了避免权限上的报错先设置权限: 1、打开浏览器输入http://jenkins.zhang-qing.com/,输入账号root和密码root登录(这是我设置的账号和密码,实际...
Helm工程化落地:管理公司内微服务-AI运维探索者

Helm工程化落地:管理公司内微服务

一、Helm管理公司内微服务 1.1 环境准备 1.1 创建Helm工作目录 创建工作目录 1.1 部署ingress-nginx 参考:[Ingress Controller 官方安装文档](https://kubernetes.github.io/ingress-nginx/depl...
Deployment 发布策略详解:Recreate、RollingUpdate 与零中断参数设计-AI运维探索者

Deployment 发布策略详解:Recreate、RollingUpdate 与零中断参数设计

一、Deployment 只有两种主流更新策略 Deployment 的更新策略主要有两类: - `Recreate` - `RollingUpdate` 默认值是 `RollingUpdate`。它们的区别并不抽象,可以直接理解成两种上线哲学: - `R...
Kubernetes集群的备份和还原-AI运维探索者

Kubernetes集群的备份和还原

一、etcd数据库备份 1、获取二进制etcdctl文件 由于我们是使用kubeadm部署,机器上没有etcdctl命令,所以需要下载个二进制包 (1)先获取对应的版本 (2)下载合适的包 (3)解压至/opt目录下 (4)将可...
EFK 部署实战:Elasticsearch 与 Kibana 在 K8S 中落地-AI运维探索者

EFK 部署实战:Elasticsearch 与 Kibana 在 K8S 中落地

一、前言 Kubernetes 中比较流行的日志收集解决方案是Elasticsearch、Fluentd 和 Kibana (EFK)技术栈,也是官方现在比较推荐的一种方案。 1.1 主要组件功能 1、Elasticsearch(ES): - 强大的...
MySQL用户管理实战:创建、查询、改密、删除与锁定-AI运维探索者

MySQL用户管理实战:创建、查询、改密、删除与锁定

一、创建数据库服务用户信息 创建数据库服务用户信息格式: '用户名称信息'@'白名单信息' * 用户名称信息:创建的用户字符串信息 * 白名单信息:网段IP地址信息或者名称信息 用户信息构成:用户...