设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 服务器 > 安全 > 正文

一篇文章全面了解监控知识体系(2)

发布时间:2021-01-11 18:24 所属栏目:53 来源:网络整理
导读:王牌监控工具: Zabbix?是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的 Agent 代理,也支持 SNMP、IPMI、JMX、Telnet、SSH 等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触

王牌监控工具:

  • Zabbix?是一个分布式监控系统,支持多种采集方式和采集客户端,有专用的 Agent 代理,也支持 SNMP、IPMI、JMX、Telnet、SSH 等多种协议,它将采集到的数据存放到数据库,然后对其进行分析整理,达到条件触发告警.其灵活的扩展性和丰富的功能是其他监控系统所不能比的.相对来说,它的总体功能做的非常优秀.从以上各种监控系统的对比来看,Zabbix 都是具有优势的,其丰富的功能、可扩展的能力、二次开发的能力和简单易用的特点,读者只要稍加学习,即可构建自己的监控系统.
  • 小米的监控系统:open-falcon.open-falcon 的目标是做最开放、最好用的互联网企业级监控产品.

三方监控工具:

现在市场上有很多不错的第三方监控,比如:监控宝、监控易、听云、还有很多云厂商自带监控,但是在这里我们不打算着重介绍,如果想了解三方监控可自行上官网咨询.(避免说广告植入)

5、监控流程

上面介绍了这么多,那么到底选择什么监控工具最合适呢,我这里推荐几款开源监控工具:Zabbix、Open-Falcon、LEPUS 天兔(专用于监控数据库).
但是本文还是基于 Zabbix 来构建整个监控体系生态圈.
那么下面我们就来聊聊,Zabbix 的整个流程:

  1. 数据采集:Zabbix 通过 SNMP、Agent、ICMP、SSH、IPMI 等对系统进行数据采集;
  2. 数据存储:Zabbix 存储在 MySQL 上,也可以存储在其他数据库服务;
  3. 数据分析:当我们事后需要复盘分析故障时,Zabbix 能给我们提供图形以及时间等相关信息,方面我们确定故障所在;
  4. 数据展示:web 界面展示、(移动 APP、java_php 开发一个 web 界面也可以) ;
  5. 监控报警:电话报警、邮件报警、微信报警、短信报警、报警升级机制等(无论什么报警都可以);
  6. 报警处理:当接收到报警,我们需要根据故障的级别进行处理,比如:重要紧急、重要不紧急等.根据故障的级别,配合相关的人员进行快速处理;

6、监控指标

我们上面了解了监控方法、目标、流程、也了解了监控有哪些工具,可能有人会疑惑,我们具体要监控些什么东西?那么我在这里进行了分类整理:

6.1 硬件监控

早期我们通过机房巡检的方式,查看硬件设备灯光闪烁情况判断是否故障,这样非常浪费人力,并且是重复性无技术含量的工作,大家懂得.

当然我们现在可以通过IPMI对硬件详细情况进行监控,并对 CPU、内存、磁盘、温度、风扇、电压等设置报警阈值(自行对监控报警内容编写合理的报警范围)
IPMI监控硬件服务参考资料

IPMI

6.2 系统监控

中小型企业基本全是 Linux 服务器,那么我们肯定要监控系统资源的使用情况,系统监控是监控体系的基础.

监控主要对象:

CPU 有几个重要的概念:上下文切换、运行队列和使用率.

这也是我们 CPU 监控的几个重点指标.
通常情况,每个处理器的运行队列不要高于3,CPU 利用率中“用户态/内核态”比例维持在70/30,空闲状态维持在50%,上下文切换要根据系统繁忙程度来综合考量.

针对 CPU 常用的工具有:htop、top、vmstat、mpstat、dstat、glances

Zabbix 提供系统监控模板:Zabbix Agent Interface

CPU整体状态

上下文切换

负载状态

内存:通常我们需要监控内存的使用率、SWAP 使用率、同时可以通过 zabbix 描绘内存使用率的曲线图形发现某服务内存溢出等.

针对内存常用的工具有: free、top、vmstat、glances

内存使用率

IO 分为磁盘 IO 和网络 IO.除了在做性能调优我们要监控更详细的数据外,那么日常监控,只关注磁盘使用率、磁盘吞吐量、磁盘写入繁忙程度,网络也是监控网卡流量即可.

常用工具有:iostat、iotop、df、iftop、sar、glances

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读