背景 在面板中,可以利用变量和html插件,渲染出配置文件。一般上监控平台会需要prometheus的配置。 job_name: <display_name></br> scr...
ansible sysctl 模块使用
修改内核参数的时候会用到此模块。 name:变量名 value:值 reload:文件被更新时,是否使用 sysctl -p reload 文件 state:是在文件中 移除(absent)或者设置(...
04.大项目管理
roles改造 一个标准项目由多个role组成目录如下: roles/ │ └── webserver/ │ ├── tasks/ │ ├── templates/ │ ├── handlers/ │...
03.变量和facts
体验变量 修改hosts文件,增加变量1,名为var1 [local] 自己的ip var1=var1 [local:vars] ansible_ssh_pass=Abc123123 创建show_v...
02.playbook
playbook样例ping模块 创建 ping.yaml 文件内容如下 --- - hosts: all tasks: - name: test connection action: ping 执行...
01.ansible基础
前置要求 为了保证我们正常学习和测试,需要至少两台服务器。 一台作为控制端 另一台作为被控制服务器 安装 只有控制节点需要安装。被控节点不用。 yum install -y ansible 配置文件位...
故障复盘-基础设施-服务器断电导致Linux重启iptables防火墙规则丢失docker容器间无法连接
今天有一个学生机房停电了,因为服务器的防火墙规则没搞持久化,所以导致docker的容器之间网络不通了。在这里复盘一下。 总结 问题描述:容器间网络不通 持续时间:预估超过12小时 故障类型:基础设施 ...
ansible中include和delegate_to、loop并用以及存在的问题
Ansible 2.4 -> 2.7, include_role and delegate_to Short description of the problem: In Ansible 2.4 it...
PromQL看这个就够了
听说我的公众号在公司又有了同事订阅,受宠若惊。写公众号被更多的人知道,这是每个号主都非常幸福的事。特别是看到周围人玩手机居然是在看我的文章的时候。这种幸福更甚。 比心 同事强烈要求我写写PromQL,...
打造云原生大型分布式监控系统
笑谈监控系统 随着时间的积累,出现故障的风险越来越高,事故的发生总是出人预料,如果采用人力运维的方式,对于故障定位、故障处理都是很大的挑战。故障的时间越长,面临的损失越大,所以在发展到一定程度的团队都...