体验变量 修改hosts文件,增加变量1,名为var1 [local] 自己的ip var1=var1 [local:vars] ansible_ssh_pass=Abc123123 创建show_v...
故障复盘-基础设施-服务器断电导致Linux重启iptables防火墙规则丢失docker容器间无法连接
今天有一个学生机房停电了,因为服务器的防火墙规则没搞持久化,所以导致docker的容器之间网络不通了。在这里复盘一下。 总结 问题描述:容器间网络不通 持续时间:预估超过12小时 故障类型:基础设施 ...
jenkins快速入门,自动构建一个hello world项目(devops,ci/cd)
jenkins是一个非常老牌的ci/cd工具,它是一款使用Java写的开源自动化应用。可以通过界面或Jenkinsfile告诉它执行什么任务,何时执行,理论上,可以让它执行任何事,一般用来做ci/cd...
mongo命令行免交互以及prometheus监控-偏运维
前言 主要记录 - mongo如何接入prometheus - 一些前置条件(开启权限、创建用户的知识) - 使用命令行快速创建用户 启用权限验证 # 临时 mongo --auth 或者修改mong...
如何更改prometheus监控系统启动的默认端口号
安装好 prometheus 以后,访问的默认端口号是 9090,通常不需要修改。但有时候情况特殊,需要把默认端口号改为自定义端口,例如改为 8091,该如何操作? 一般情况,prometheus 有...
Prometheus和Grafana告警服务创建与对接腾讯云短信告警平台(prometheus_alert)
前言 在一个监控系统中,如果说数据链路是她的骨架,那么告警通知服务就是他的灵魂!所有的监控服务都是为了能够及时通知出来,减少人工查询状态,及时发现问题,避免不必要的大规模故障,为企业政府省钱,和保证安...
01.ansible基础
前置要求 为了保证我们正常学习和测试,需要至少两台服务器。 一台作为控制端 另一台作为被控制服务器 安装 只有控制节点需要安装。被控节点不用。 yum install -y ansible 配置文件位...
ansible roles中常用的语法以及高级特性汇总
摘要:本节主要总结ansible roles中常用的语法以及高级特性、例如变量、下载、解压、修改文件内容等,便于使用ansible协同开发,做更加庞大的任务。 常用 远程执行脚本 脚本放到templa...
打造云原生大型分布式监控系统
笑谈监控系统 随着时间的积累,出现故障的风险越来越高,事故的发生总是出人预料,如果采用人力运维的方式,对于故障定位、故障处理都是很大的挑战。故障的时间越长,面临的损失越大,所以在发展到一定程度的团队都...
linux系统 物理硬盘监控
摘要:监控系统在linux系统上获取物理磁盘IO以及使用情况的原理,让我们一起来探索一下 本文使用语言为c++ 物理磁盘列表和磁盘IO 第一步要解决的问题是先识别物理磁盘是哪些。 上图是/proc/d...