可观测性与运维 第8页
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置-AI运维探索者

Prometheus Operator 优化:持久化、规则与 Alertmanager 配置

一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
Prometheus介绍和安装-AI运维探索者

Prometheus介绍和安装

一、Prometheus介绍 **Prometheus定义** Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维...
SkyWalking 自定义告警:OAL 指标扩展与接口异常告警-AI运维探索者

SkyWalking 自定义告警:OAL 指标扩展与接口异常告警

- 一、为什么需要自定义告警? - 1、满足不同的监控需求; - 2、结合链路追踪及告警规则,更高效解决问题; 一、场景定义 1.1 需求 **场景描述**:公司主营业务为在线购物网站,那么 HTTP 服务...
Elasticsearch集群原理:倒排索引、节点角色与读写流程-AI运维探索者

Elasticsearch集群原理:倒排索引、节点角色与读写流程

一、倒排索引 面试题: 分片底层时如何工作的? 答: 分片底层对应的是一个Lucene库,而Lucene底层使用倒排索引技术实现。 **正排索引(正向索引):** 我们MySQL为例,用id字段存储博客文章的编号,...
Prometheus 自定义监控:接入 MySQL 指标-AI运维探索者

Prometheus 自定义监控:接入 MySQL 指标

一、自定义中间件监控 1.1 创建mysql监听用户并授权,注意服务ip不要填错 1.2 启动容器 1.2 启动监控容器 创建配置文件 启动容器并挂载配置 验证容器 1.2 可能遇到的问题 执行下面命令启动容器 ...
Prometheus:AlertManager配置邮件告警-AI运维探索者

Prometheus:AlertManager配置邮件告警

一、获取qq邮箱二维码。 点击【Settings】 点击【服务】 按照提示发送短信,获取授权码bcreknhkuijidifd 二、将Alertmanager的配置文件从configMap里导出来 三、编辑配置文件 删除无用配置,要...
Filebeat实战:按命名空间采集Kubernetes日志-AI运维探索者

Filebeat实战:按命名空间采集Kubernetes日志

一、使用Filebeat收集指定空间的日志 有时候可能只需要收集部分空间的日志,而并不是收集所有的日志,此时通过修改 Filebeat的配置,实现只收集部分空间的日志。 假如只收集 krm 和 kube-system...
ELK与EFK日志收集架构分析-AI运维探索者

ELK与EFK日志收集架构分析

一、ELK架构 在传统架构中,比较成熟且流行的日志收集平台非ELK(Elasticsearch + Logstash + Kibana)莫属,其中Logstash负责采集日志,并输出至Elasticsearch,之后用Kibana进行展示。 缺点:...
AlertManager告警分组和告警抑制:抑制-AI运维探索者

AlertManager告警分组和告警抑制:抑制

一、示例1: 将如下配置增加到alertmanager_config.yaml里 **说明:当集群中的某一个主机节点异常宕机导致告警NodeDown被触发,同时在告警规则中定义了告警级别severity=Critical。由于主机异常...
Prometheus 黑盒监控:K8S 内部 HTTP 探测-AI运维探索者

Prometheus 黑盒监控:K8S 内部 HTTP 探测

一、HTTP 监控(K8S 内部发现方法) 1.1 自定义发现 `Service` 监控 `端口` 和 `路径` 可以如下设置: 然后,需要在 `Service` 中配置这样的 `annotation` : 示例:Java应用的svc: 按上面方法...