可观测性与运维 第4页
Prometheus:kube-state-metrics和metrics-server-AI运维探索者

Prometheus:kube-state-metrics和metrics-server

一、kube-state-metrics 1、介绍 Kube-state-metrics 是一个Kubernetes组件,它提供了一种将 Kubernetes 集群中各资源状态信息转化为可监控指标的方法,以帮助用户更好地理解和监控集群的健康状...
Elasticsearch RPM部署实战:环境准备、单点上线与集群搭建-AI运维探索者

Elasticsearch RPM部署实战:环境准备、单点上线与集群搭建

一、环境准备 1.1 机器配置(3台) | CPU | 2C | |--------|------| | MEMORY | 4G | | DISK | 50G+ | 1.2 机器信息(3台) | 主机名 | 主机IP | |--------|---------------| | elk121 | 192.168.1....
Prometheus 自定义监控:使用 Process Exporter 监控进程-AI运维探索者

Prometheus 自定义监控:使用 Process Exporter 监控进程

一、process-exporter进程监控 1.1 模拟sd-api进程 模拟启动两个进程 1.2 创建挂载目录 1.3 配置安装process-exporter 1.4 配置文件 - 匹配 sd-api 的进程(ps -ef | grep sd-api) - 通过proce...
Prometheus+Alertmanager实战:域名访问延迟告警-AI运维探索者

Prometheus+Alertmanager实战:域名访问延迟告警

一、创建一个 PrometheusRule 上面参数说明: * `apiVersion`: 这个字段指定了使用的 Kubernetes API 版本,`monitoring.coreos.com/v1` 表示使用了 Prometheus Operator 中的自定义资源版本 * ...
Prometheus静态配置监控Windows主机实战-AI运维探索者

Prometheus静态配置监控Windows主机实战

一、Prometheus监控非云原生应用流程 上面流程图说明: 针对非云原生应用一般本身不存在一个/metrics接口,我们需要配置Exporter来指向非云原生应用Service(集群外部的应用也需要指定具体IP)...
Filebeat实战:按命名空间采集Kubernetes日志-AI运维探索者

Filebeat实战:按命名空间采集Kubernetes日志

一、使用Filebeat收集指定空间的日志 有时候可能只需要收集部分空间的日志,而并不是收集所有的日志,此时通过修改 Filebeat的配置,实现只收集部分空间的日志。 假如只收集 krm 和 kube-system...
Prometheus监控Kubernetes集群-AI运维探索者

Prometheus监控Kubernetes集群

一、监控集群节点 先把Configmap导出为yaml文件: 编辑yaml,在scrape_configs: 下面增加如下内容 应用配置 重启Prometheus服务 打开浏览器输入http://192.168.1.31:31093访问Prometheus,到Prom...
Skywalking:安装ElasticSearch-AI运维探索者

Skywalking:安装ElasticSearch

一、首先确认是否已经加载bitnami仓库。 如果没有,还需额外增加此仓库 二、下载ElasticSearch的chart包 三、安装ElasticSearch 注意:要保证K8S所有节点内存大于4G,否则ElasticSearch跑不动 3...
Prometheus:AlertManager配置邮件告警-AI运维探索者

Prometheus:AlertManager配置邮件告警

一、获取qq邮箱二维码。 点击【Settings】 点击【服务】 按照提示发送短信,获取授权码bcreknhkuijidifd 二、将Alertmanager的配置文件从configMap里导出来 三、编辑配置文件 删除无用配置,要...
Prometheus 节点监控:部署 node-exporter 并抓取主机指标-AI运维探索者

Prometheus 节点监控:部署 node-exporter 并抓取主机指标

一、node-exporter Node Exporter 是 Prometheus 官方提供的一个节点资源采集组件,可以用于收集服务器节点的数据,如 CPU频率信息、磁盘IO统计、剩余可用内存等等。 **部署创建:** 由于是针对...