今天有一个学生机房停电了,因为服务器的防火墙规则没搞持久化,所以导致docker的容器之间网络不通了。在这里复盘一下。 总结 问题描述:容器间网络不通 持续时间:预估超过12小时 故障类型:基础设施 ...
ansible中include和delegate_to、loop并用以及存在的问题
Ansible 2.4 -> 2.7, include_role and delegate_to Short description of the problem: In Ansible 2.4 it...
PromQL看这个就够了
听说我的公众号在公司又有了同事订阅,受宠若惊。写公众号被更多的人知道,这是每个号主都非常幸福的事。特别是看到周围人玩手机居然是在看我的文章的时候。这种幸福更甚。 比心 同事强烈要求我写写PromQL,...
打造云原生大型分布式监控系统
笑谈监控系统 随着时间的积累,出现故障的风险越来越高,事故的发生总是出人预料,如果采用人力运维的方式,对于故障定位、故障处理都是很大的挑战。故障的时间越长,面临的损失越大,所以在发展到一定程度的团队都...
Prometheus/postgreSQL内置函数集锦
一些函数有默认的参数,例如:year(v=vector(time()) instant-vector)。v是参数值,instant-vector是参数类型。vector(time())是默认值。 ab...
Prometheus 监控之 Blackbox_exporter黑盒监测 [icmp、tcp、http(get\post)、dns、ssl证书过期时间]
Blackbox_exporter 主动监测主机与服务状态 Prometheus 官方提供的 exporter 之一,可以提供 http、dns、tcp、icmp 的监控数据采集 官方gith...
mongo命令行免交互以及prometheus监控-偏运维
前言 主要记录 - mongo如何接入prometheus - 一些前置条件(开启权限、创建用户的知识) - 使用命令行快速创建用户 启用权限验证 # 临时 mongo --auth 或者修改mong...
prometheus HA高可用 m3db集群远程存储
简介 本文介绍了基于 prometheus+keepalived+haproxy+m3db 集群实现的监控高可用方案。 转自:CSDN 本文将带大家一步一步的实现基于 prometheus 的监控高可...
jenkins快速入门,自动构建一个hello world项目(devops,ci/cd)
jenkins是一个非常老牌的ci/cd工具,它是一款使用Java写的开源自动化应用。可以通过界面或Jenkinsfile告诉它执行什么任务,何时执行,理论上,可以让它执行任何事,一般用来做ci/cd...
jenkins使用
jenkins是一个非常老牌的ci/cd工具,它是一款使用Java写的开源自动化应用。可以通过界面或Jenkinsfile告诉它执行什么任务,何时执行,理论上,可以让它执行任何事,一般用来做ci/cd...