可观测性与运维共139篇
Kubernetes日志收集基础:日志类型、技术栈与工具对比-AI运维探索者

Kubernetes日志收集基础:日志类型、技术栈与工具对比

一、有哪些日志需要收集管理? 在日常使用控制过程中,一般需要收集的日志为以下几类: * 服务器系统日志 * /var/log/messages * /var/log/kube-xxx.log * Kubernetes组件日志(/var/log/kube.*)...
Prometheus 黑盒监控:ICMP 探测配置实战-AI运维探索者

Prometheus 黑盒监控:ICMP 探测配置实战

一、ICMP监控 按上面方法重载 Prometheus,打开 Prometheus 的 Target 页面,就会看到 上面定义的 `blackbox-k8s-http-services` 任务
Prometheus介绍和安装-AI运维探索者

Prometheus介绍和安装

一、Prometheus介绍 **Prometheus定义** Prometheus(普罗米修斯)是一个最初在SoundCloud上构建的监控系统。自2012年成为社区开源项目,拥有非常活跃的开发人员和用户社区。为强调开源及独立维...
ServiceMonitor入门:定义、价值与工作机制-AI运维探索者

ServiceMonitor入门:定义、价值与工作机制

一、ServiceMonitor是什么 ServiceMonitor 是 Prometheus Operator 提供的一种 Kubernetes 自定义资源(Custom Resource),用于告诉 Prometheus 如何监控服务(Service)。它是 Prometheus Ope...
使用 Zabbix 监控 Nginx 服务与 80 端口状态-AI运维探索者

使用 Zabbix 监控 Nginx 服务与 80 端口状态

一、自定义nginx模板 1.1 客户端安装nginx 1、进入nginx官网,复制官方yum源 Nginx官网链接: <img src="https://bucketbucket1.oss-cn-beijing.aliyuncs.com/imag/d5df0ed2a9d0_
Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS-AI运维探索者

Prometheus 集群监控:接入 scheduler、kube-state-metrics 与 CoreDNS

一、scheduler >由上可知,匹配pod对象,lable标签为component=kube-scheduler即可scheduler和controller-manager一样,默认监听0端口,需要注释 所有Master节点修改 `/etc/kubernetes/manif...
日志平台设计:如何搭建有价值的日志分析体系-AI运维探索者

日志平台设计:如何搭建有价值的日志分析体系

一、日志规范 在K8S架构中,为了统一和标准化日志格式,可以使用以下几种常见的日志规范: 1、日志格式规范: - 结构化日志:使用结构化日志格式,如JSON、XML 或 Key-Value Pair(键值 对)格...
Elasticsearch运维进阶:多实例、Head、Postman与故障排查-AI运维探索者

Elasticsearch运维进阶:多实例、Head、Postman与故障排查

一、ES集群的多实例部署 1、在elk121节点上配置集群免密登录及同步脚本 在elk121节点上修改主机列表 在elk121节点上生成密钥对 | \[root@elk121 ~\]ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa -...
Filebeat实战:按标签采集Kubernetes日志-AI运维探索者

Filebeat实战:按标签采集Kubernetes日志

一、使用Filebeat根据标签收集日志 除了逐个配置 Namespace,也可以根据 Namespace 的标签进行过滤,更加方便。 比如只收集 Namespace 具有 filebeat=true 标签的空间日志: 1、备份配置文件 2...
Zabbix 邮件与企业微信告警配置实战-AI运维探索者

Zabbix 邮件与企业微信告警配置实战

一、告警分类 | 报警方式 | 企业应用场景 | |--------------------------------------|--------------------------------------------------| | 发邮件 | 企业邮箱,免费使用 | | 企业微信-告警...