可观测性与运维-AI运维探索者-第14页

更新

浏览

Prometheus监控Etcd实战：证书、Service与ServiceMonitor

一、Prometheus监控云原生应用流程上面流程图说明：针对云原生应用一般本身都存在一个/metrics接口，我们需要配置一个Service指向云原生应用（集群外部的应用需要应用Service指定具体IP）。同...

# 监控告警 # Prometheus # 指标监控

3年前

0545

SkyWalking UI 访问控制：Auth 生成、Secret 创建与 Ingress 改造

一、用于skywalking ui访问控制的secret skywalking的 ui界面默认没有访问控制，可以通过下面基于 Nginx Ingress的basic auth方案，实现自定义服务的外部验证画重点：这里使用 basic有个小坑，...

# 链路追踪 # Skywalking # APM

3年前

0545

Prometheus：更新consul配置到Prometheus

一、编辑prometheus_config.yaml,在 scrape_configs: 下面增加，如下。 **说明：因为consul-ui服务地址如果重启会发生变化，所以这里选择服务名** 二、重新导入配置三、重启Prometheus服务四...

# 监控告警 # Prometheus # 指标监控

3年前

0425

ECK实战：在Kubernetes中从零落地日志收集平台

一、在K8s中从零落地日志收集平台官方文档：https://www.elastic.co/docs/deploy-manage/deploy/cloud-on-k8s 1.1 ECK安装参考链接：https://www.elastic.co/docs/deploy-manage/deploy/cloud...

# Kubernetes # 云原生 # 日志采集

3年前

0355

Alertmanager入门：核心概念与主要功能

一、Alertmanager基本概念 Prometheus 警报分为两部分。Prometheus 服务器中的警报规则将警报发送到警报管理器。然后，Alertmanager 管理这些警报，包括沉默、抑制、聚合以及通过电子邮件、待命...

# 监控告警 # Prometheus # 指标监控

3年前

0265

Elasticsearch运维进阶：多实例、Head、Postman与故障排查

一、ES集群的多实例部署 1、在elk121节点上配置集群免密登录及同步脚本在elk121节点上修改主机列表在elk121节点上生成密钥对 | \[root@elk121 ~\]ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa -...

# Elasticsearch # 搜索引擎 # 数据检索

3年前

0555

Elasticsearch集群原理：倒排索引、节点角色与读写流程

一、倒排索引面试题: 分片底层时如何工作的？答: 分片底层对应的是一个Lucene库，而Lucene底层使用倒排索引技术实现。 **正排索引(正向索引):** 我们MySQL为例，用id字段存储博客文章的编号，...

# Elasticsearch # 搜索引擎 # 数据检索

3年前

0355

AlertManager告警分组和告警抑制：抑制

一、示例1：将如下配置增加到alertmanager_config.yaml里 **说明：当集群中的某一个主机节点异常宕机导致告警NodeDown被触发，同时在告警规则中定义了告警级别severity=Critical。由于主机异常...

# 监控告警 # Prometheus # 指标监控

3年前

0265

Prometheus Operator 自定义监控：Helm 版 Ingress-Nginx

一、自定义资源 Prometheus-operator 通过定期循环watch apiserver，获取到CRD资源（比如 servicemonitor）的创建或者更新，将配置更新及时应用到运行中的prometheus pod 中转换成标准promethes...

# 监控告警 # Prometheus # 指标监控

3年前

0385

上一页 1…12 1314跳转