怎么配置一个监控项



白脉软膏对外伤白癜风治疗效果如何 http://pf.39.net/bdfyy/tslf/190620/7232727.html

线上系统,监控报警必不可少,这篇文章说一下我目前是如何配置一个监控项的

这里只是一个检查列表,并不是指某一个具体的监控指标(说句题外话,检查列表绝对是做事工具箱中的一个利器,无论在什么领域,用好它可以减少犯错,提高效率,哈哈),下面开始列表内容

此检查列表包括三个阶段:配置前,配置中,配置后

第一阶段,配置之前,主要在思考,思考以下内容

1、给监控项起一个易懂的名字

2、这个指标代表什么意义?

3、是否和现有的指标重复?

4、报警级别应该是什么?

5、阈值怎么设置?

6、什么时候应该修改阈值?

7、什么时候可以下掉这个报警?

8、如何进行测试?

9、收到报警后应该怎么处理?

10、处理过程是否可以自动化?

11、配置过程中出现问题应该向哪些人或者团队求助?

12、是否找人review过上述方案?

第二阶段,配置中,也就是执行阶段,配置前思虑周全,执行起来会简单很多

1、先知会其他人你要开始配置报警了,防止配置过程中误报警引起恐慌

2、如果是修改指标,一定要记录老版本,以便出错时回滚

3、最好上午配置,这样有一个白天的时间试运行,降低半夜surprise的可能性

第三阶段,配置后,确认结果并周知到相关人员

1、本次修改测试成功了吗?

2、是否准备好了详细的参考文档?

3、是否向相关人员做了分享?

窃以为,以上流程全部做完,才算真正配置好了一项监控

当然,后续可能还包括阈值的不断调整,报警的下线等,都可以用上述的思路进行处理

(完)

进一寸欢喜一寸

如果有帮助,请我喝杯茶?哈哈哈




转载请注明:http://www.imbnc.com/mlyzd/13007.html