在日常的工作中,主要是和IT产品相关的技术研发点对来说应该都对监控系统不陌生。因为特别是线上的系统,监控系统几乎都是标配,他相当于我们的第三只眼,对于我们来说,每次上班第一件事就是查看线上的监控系统,查看线上服务是否运行稳定,是否可能存在异常信息等等。
所以毋庸置疑,监控系统对于我们来说的重要性如何。所以基于此,我们对于监控系统来说,编写一个专门介绍监控系统的系列,让大家对监控系统有更深层次的了解。
本文我们主要介绍下监控系统的作用有哪些?
其实监控系统的作用很多,这里我们列举下:
1、实时采集监控数据
对于监控系统来说,他主要是针对我们想要监控的目标配置相关的数据采集,包括不仅限于:
1、硬件数据采集 2、操作系统数据采集 3、组件设施的数据采集 4、应用程序的数据采集 5、等等
2、实时反馈监控状态
数据采集完成之后,接下来就是通过可视化的dashboard实时的对我们的监控目标做多维度相关的统计及相关的可视化展示,他能展示的数据有:
1、监控目标的时间窗口统计信息 2、监控目标的状态是正常还是异常。
3、预知故障和告警
监控系统一般都和告警系统相搭配,根据我们配置的预警指标,当出现异常的时候,可以通过邮件、短信、webhook等方式通知到我们,让我们及时应对和解决相关的故障。
4、辅助定位故障
根据采集到实时数据指标,我们能结合时间点,采集指标,采集原始数据等因素来辅助定位各种故障。
5、辅助性能优化
系统建设初期一般很少考虑性能方面的影响,一般主要以业务相关联,我们通过监控系统能一目了然的看到对应的监控目标是否存在性能问题,例如:
1、响应变慢 2、连接超时 3、cpu使用率偏高 4、内存使用率偏高 5、等等
结合这些监控情况,对咱们得系统有针对性的进行性能优化。并且根据后续的进一步监控,可观察到咱们得性能优化情况如何。
6、辅助容量规划
通过对一些硬盘,内存等使用情况的时间窗口表现情况,可以有利于我们对未来系统扩展做相关的容量规划。
7、辅助自动化运维
现如今除了一些小公司团队还在使用人肉运维之外,其实我们很多时候都会搭建自动化运维工具,方便我们搭建部署系统的时候实现自动化运维。所以对于监控系统来说,涉及到比如一些服务突然挂掉需要重启等,就可以直接从监控系统对接到自动化运维平台。实现自动化运维。
当然还有很多其他方面的用处,这里到时候想到了再补充。
最后总结下,监控系统是非常重要的一个环节,加强监控系统的建设,能更加良好的保障线上服务的平稳运行。
还没有评论,来说两句吧...