排序
Prometheus Operator 优化:持久化、规则与 Alertmanager 配置
一、数据持久化 1.1 prometheus数据持久化 默认Prometheus和Grafana不做数据持久化,那么服务重启以后配置的Dashboard、 账号密码、监控数据等信息将会丢失,所以做数据持久化也是很有必要的。 ...
Prometheus的Exporter
一、Node Exporter Node Exporter主要用来采集主机上的各种指标(如CPU、内存、磁盘、网络等),Node exporter作为一个独立的进程在主机上运行,并通过HTTP端点暴露指标数据。Prometheus可以定...
Loki 场景实践:虚机日志、Java 应用日志与生产优化
- 一、背景 - 非K8S集群节点,单独部署某个特殊应用或Job的虚机; - 各个应用间的日志数据非同一目录; - 当前K8S环境中已经部署了Loki日志管理系统; 一、非K8S集群虚机日志收集 1.1 安装和配...
ECK实战:在Kubernetes中从零落地日志收集平台
一、在K8s中从零落地日志收集平台 官方文档:https://www.elastic.co/docs/deploy-manage/deploy/cloud-on-k8s 1.1 ECK安装 参考链接:https://www.elastic.co/docs/deploy-manage/deploy/cloud...
SkyWalking 自定义告警:OAL 指标扩展与接口异常告警
- 一、为什么需要自定义告警? - 1、满足不同的监控需求; - 2、结合链路追踪及告警规则,更高效解决问题; 一、场景定义 1.1 需求 **场景描述**:公司主营业务为在线购物网站,那么 HTTP 服务...
Elasticsearch集群原理:倒排索引、节点角色与读写流程
一、倒排索引 面试题: 分片底层时如何工作的? 答: 分片底层对应的是一个Lucene库,而Lucene底层使用倒排索引技术实现。 **正排索引(正向索引):** 我们MySQL为例,用id字段存储博客文章的编号,...
Prometheus 容器监控:接入 cAdvisor
一、cAdvisor **cAdvisor 主要功能:** - 对容器资源的使用情况和性能进行监控。它以守护进程方式运行,用于收集、聚 合、处理和导出正在运行容器的有关信息。 - cAdvisor 本身就对 Docker 容器...
Elasticsearch集群迁移实战:_reindex与Logstash跨集群同步
一、部署ES6分布式集群 1、 2、结果验证 二、基于_reindex的API迁移 2.1 环境准备 1、搭建好两套多实例集群 2、在ES6环境创建文档 **注意:在Postman执行时需要单个单个执行,上面只是为了方便...
Alertmanager自定义邮件模板实战
一、修改alertmanager-secret.yaml添加自定义模板 添加告警模板 **注意:wechat.tmpl和alertmanager.yaml需要对齐** 在templates字段添加模板位置 配置wechat-ops receiver使用该模板 配置警报重...
SkyWalking 高级告警配置:独立规则与复合规则
一、SkyWalking告警规则 [Alarm | Apache SkyWalking](https://skywalking.apache.org/docs/main/v9.0.0/en/setup/backend/backend-alarm/) 告警规则有两种类型,单独规则(Individual Rules)...











