怎么配置一个监控项
白脉软膏对外伤白癜风治疗效果如何 http://pf.39.net/bdfyy/tslf/190620/7232727.html
线上系统,监控报警必不可少,这篇文章说一下我目前是如何配置一个监控项的
这里只是一个检查列表,并不是指某一个具体的监控指标(说句题外话,检查列表绝对是做事工具箱中的一个利器,无论在什么领域,用好它可以减少犯错,提高效率,哈哈),下面开始列表内容
此检查列表包括三个阶段:配置前,配置中,配置后
第一阶段,配置之前,主要在思考,思考以下内容
1、给监控项起一个易懂的名字
2、这个指标代表什么意义?
3、是否和现有的指标重复?
4、报警级别应该是什么?
5、阈值怎么设置?
6、什么时候应该修改阈值?
7、什么时候可以下掉这个报警?
8、如何进行测试?
9、收到报警后应该怎么处理?
10、处理过程是否可以自动化?
11、配置过程中出现问题应该向哪些人或者团队求助?
12、是否找人review过上述方案?
第二阶段,配置中,也就是执行阶段,配置前思虑周全,执行起来会简单很多
1、先知会其他人你要开始配置报警了,防止配置过程中误报警引起恐慌
2、如果是修改指标,一定要记录老版本,以便出错时回滚
3、最好上午配置,这样有一个白天的时间试运行,降低半夜surprise的可能性
第三阶段,配置后,确认结果并周知到相关人员
1、本次修改测试成功了吗?
2、是否准备好了详细的参考文档?
3、是否向相关人员做了分享?
窃以为,以上流程全部做完,才算真正配置好了一项监控
当然,后续可能还包括阈值的不断调整,报警的下线等,都可以用上述的思路进行处理
(完)
进一寸欢喜一寸如果有帮助,请我喝杯茶?哈哈哈
转载请注明:http://www.imbnc.com/mlyzd/13007.html
- 上一篇文章: 常见的易错点高一上
- 下一篇文章: 没有了