设为首页 - 加入收藏 ASP站长网(Aspzz.Cn)- 科技、建站、经验、云计算、5G、大数据,站长网!
热搜: 手机 数据 公司
当前位置: 首页 > 服务器 > 安全 > 正文

轻松监控上万台服务器:企业运维监控平台架构设计与实践指南(2)

发布时间:2021-01-04 14:07 所属栏目:53 来源:网络整理
导读:data_source:此参数定义了集群名字,以及集群中的节点.Cluster1就是这个集群的名称,cloud0和cloud2指明了从这两个节点收集数据,Cluster1后面指定的节点名可以是IP地址,也可以是主机名,由于采用了multicast模式,每个

  • data_source:此参数定义了集群名字,以及集群中的节点.Cluster1就是这个集群的名称,cloud0和cloud2指明了从这两个节点收集数据,Cluster1后面指定的节点名可以是IP地址,也可以是主机名,由于采用了multicast模式,每个gmond节点都有本Cluster1集群节点所有监控数据,因此不需要把所有节点都写入data_source中.但是建议写入不低于2个,这样,在cloud0节点出现故障的时候,gmetad会自动到cloud2节点采集数据,这样就保证了Ganglia监控系统的高可用性.

上面通过data_source参数定义了一个服务器集群Cluster1,对于要监控多个应用系统的情况,还可以对不同用途的主机进行分组,定义多个服务器集群,分组方式可以通过下面的方法定义:

服务器集群Cluster1

可以通过定义多个data_source来实现监控多个服务器集群,而每个服务器集群在定义集群节点的时候,可以采用主机名或IP地址等形式,也可以加端口,如果不加端口,默认端口是8649,同时可以设定采集数据的频率,如上面的“10 localhost、50 1.3.4.7:8655”等,分别表示每隔10秒钟、50秒钟采集一次数据.

  • gridname:此参数是定义一个网格名称.一个网格有多个服务器集群组成,每个服务器集群由“data_source”选项来定义.
  • xml_port:此参数定义了一个收集数据汇总的交互端口,如果不指定,默认是8651,可以通过telnet这个端口得到监控管理端收集到的客户端的所有数据.
  • interactive_port:此参数定义了Web端获取数据的端口,这个端口在配置Ganglia的Web监控界面时需要指定.
  • rrd_rootdir:此参数定义了rrd数据库的存放路径,gmetad在收集到监控数据后会将其更新到该目录下的对应的rrd数据库中.

4、Ganglia的客户端配置

Ganglia监控客户端gmond安装完成后,配置文件位于Ganglia安装路径的etc目录下,名称为gmond.conf,这个配置文件稍微复杂,如下所示:

5、Ganglia web端配置

Ganglia的web监控界面是基于PHP的,因此需要安装PHP环境.

有两种方式安装Ganglia的web监控界面,一种是yum直接安装,另一种是通过源码安装.PHP环境的安装这里不做介绍,大家可以在http://sourceforge.net/projects/ganglia/files/下载ganglia-web的最新版本,然后将ganglia-web程序放到Apche Web的根目录即可,这里我们下载的版本是ganglia-web-3.7.1.

配置Ganglia的Web界面比较简单,只需要修改几个php文件即可.首先是conf_default.php,可以将conf_default.php重命名为conf.php,也可以保持不变,Ganglia的Web默认先找conf.php,找不到会继续找conf_default.php,需要修改的内容如下:

这里需要说明的是:“$conf[‘dwoo_compiled_dir’]”和“$conf[‘dwoo_cache_dir’]”指定的路径在默认情况下可能不存在,因此需要手动建立compiled和cache目录,并授予Linux下“777”的权限.另外,rrd数据库的存储目录/opt/app/ganglia/rrds一定要保证rrdtool可写,因此需要执行授权命令:

这样rrdtool才能正常读取rrd数据库,进而将数据通过Web界面展示出来.其实ganglia-web的配置还是比较简单的,一旦配置出错会给出提示,根据错误提示进行问题排查,一般都能找到解决方法.

四、扩展Ganglia监控功能

1、通过gmetric接口扩展Ganglia监控

gmetric是Ganglia的一个命令行工具它可以将数据直接发送到负责收集数据的gmond节点,或者广播给所有gmond节点.

在Ganglia安装完成后,会在bin目录下生成gmetric命令.下面通过一个实例介绍一下gmetric的使用方法:

其中:

-n,表示要监控的指标名.

-v,表示写入的监控指标值.

-t,表示写入监控数据的类型.

-u,表示监控数据的单位.

-d,表示监控指标的存活时间.

-c,用于指定ganglia配置文件的位置.

-S,表示伪装客户端信息,8.8.8.8代表伪装的客户端地址,cloud1代表被监控主机的主机名.

2、python扩展插件

现成可用扩展插件:

https://github.com/ganglia/gmond_python_modules

五、Ganglia的优势与注意事项

(编辑:ASP站长网)

网友评论
推荐文章
    热点阅读