设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 服务器 > 安全 > 正文

基于InfluxDB+Grafana打造大数据监控利器(2)

发布时间:2021-01-18 07:39 所属栏目:53 来源:网络整理
导读:没有比”可视化“更好的一个词能来概括运维的本质,我想Grafana也是深知广大运维人员的痛处:如何用可视化数据说话? 所以Grafana在 4.0以后版本:新增报警功能(Alerting),根据官网介绍,Grafana报警方式也有很多种,常

没有比”可视化“更好的一个词能来概括运维的本质,我想Grafana也是深知广大运维人员的痛处:如何用可视化数据说话? 所以Grafana在 4.0以后版本:新增报警功能(Alerting),根据官网介绍,Grafana报警方式也有很多种,常见的Email、Slack即时通讯、webhook等.

下图为目前集群Grafana监控界面,主要包含对集群主机CPU、内存配合Grafana的阈值预警功能:

主机内存和CPU使用率监控:

通过规则配置,可配置相关监控规则,包含相关逻辑与时间跨度以及监控告警条件.目前,仅支持一种条件类型—— Query .可以指定Query字母,时间跨度和聚合函数.字母指定你在Metrics tab里设置的聚合函数.Query的结果和聚合函数将会是一个单一的值,用于后面判断是否超过了阈值.

规则配置完成后可在报警列表里统一查看报表状态:

三、实践案例

1、数据采集规划

目前采集数据主要来源于Hadoop的jmx监控,获取相关Cluster、Queue等Metrics信息以及部分Oracle日志信息,通过相关接口写入InfluxDB数据库,根据来源及日志信息从数据库层进行独立管理设计,以便后续维护.

2、InfluxDB数据库权限配置

InfluxDB自带权限控制,权限分别为:

  • ADMIN:所有者
  • READ :只读 (精确到库与表)
  • WRITE:只写 (精确到库与表)
  • ALL (READ 和 WRITE ) :读和写

鉴于源数据流,目前只会用到三个角色,对于这三个角色分工如下:

  • ADMIN:维护人员
  • READ:数据展示与后台查询(Grafana上设置的Influnxdb为只读)
  • WRITE:外部程序(插入数据至Influnxdb)

配置数据库权限需开启相关认证,操作如下:

vi /etc/InfluxDB/InfluxDB.conf

把 [http] 标签下的 auth-enabled 选项值改为 true

[http]

enabled = true

bind-address = “:8086”

auth-enabled = true

log-enabled = true

write-tracing = false

pprof-enabled = false

https-enabled = false

https-certificate = “/etc/ssl/InfluxDB.pem”

3、Influnxdb和Grafana高可用配置

本次实践为了避免因主机通断而导致Influnxdb和Grafana服务无法使用的情况,所以在部署应用时用了2台虚拟机,2台虚拟机安装的服务如下:

 

在系统层方面又做了如下设置:

  • 主机域名设置

将两台主机设置为主备模式,共用同一个域名http://xxx.xxx.com

?

  • 负载均衡设置

负载均衡设置即VIP主用与容灾端域名+端口与的Localhost-01~02主备节点域名+端口映射.大家都知道InfluxDB和Grafana端口如下图展示:

?

所以映射关系可设计成这样:

  • VIP:主用ip、容灾ip
  • VPORT:8083
  • 均衡算法:pi 32 rr
  • 健康检查:tcp
  • 实例IP及端口:Localhost-01的ip 8083Localhost-02的ip 8083

其它端口均按此设置,负载均衡设置完成后,这里不得不提Grafana配置,如果要做到可视化展示的高可用,那么Grafana配置数据源就必须采用域名+端口的方式:

至此数据安全设置完毕.

4、Grafana界面配置

完成以上环境配置,根据相关需求进行Grafana界面配置以及监控配置,具体操作可以参照官网操作教程,这里不再赘述.

HDFS目录配额监控:

HDFS空间使用率监控:

文章来自微信公众号:DBAplus社群

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读