轻松监控上万台服务器:企业运维监控平台架构设计与实践指南(2)
上面通过data_source参数定义了一个服务器集群Cluster1,对于要监控多个应用系统的情况,还可以对不同用途的主机进行分组,定义多个服务器集群,分组方式可以通过下面的方法定义: 可以通过定义多个data_source来实现监控多个服务器集群,而每个服务器集群在定义集群节点的时候,可以采用主机名或IP地址等形式,也可以加端口,如果不加端口,默认端口是8649,同时可以设定采集数据的频率,如上面的“10 localhost、50 1.3.4.7:8655”等,分别表示每隔10秒钟、50秒钟采集一次数据.
4、Ganglia的客户端配置Ganglia监控客户端gmond安装完成后,配置文件位于Ganglia安装路径的etc目录下,名称为gmond.conf,这个配置文件稍微复杂,如下所示: 5、Ganglia web端配置Ganglia的web监控界面是基于PHP的,因此需要安装PHP环境. 有两种方式安装Ganglia的web监控界面,一种是yum直接安装,另一种是通过源码安装.PHP环境的安装这里不做介绍,大家可以在http://sourceforge.net/projects/ganglia/files/下载ganglia-web的最新版本,然后将ganglia-web程序放到Apche Web的根目录即可,这里我们下载的版本是ganglia-web-3.7.1. 配置Ganglia的Web界面比较简单,只需要修改几个php文件即可.首先是conf_default.php,可以将conf_default.php重命名为conf.php,也可以保持不变,Ganglia的Web默认先找conf.php,找不到会继续找conf_default.php,需要修改的内容如下: 这里需要说明的是:“$conf[‘dwoo_compiled_dir’]”和“$conf[‘dwoo_cache_dir’]”指定的路径在默认情况下可能不存在,因此需要手动建立compiled和cache目录,并授予Linux下“777”的权限.另外,rrd数据库的存储目录/opt/app/ganglia/rrds一定要保证rrdtool可写,因此需要执行授权命令: 这样rrdtool才能正常读取rrd数据库,进而将数据通过Web界面展示出来.其实ganglia-web的配置还是比较简单的,一旦配置出错会给出提示,根据错误提示进行问题排查,一般都能找到解决方法. 四、扩展Ganglia监控功能1、通过gmetric接口扩展Ganglia监控gmetric是Ganglia的一个命令行工具它可以将数据直接发送到负责收集数据的gmond节点,或者广播给所有gmond节点. 在Ganglia安装完成后,会在bin目录下生成gmetric命令.下面通过一个实例介绍一下gmetric的使用方法: 其中:-n,表示要监控的指标名. -v,表示写入的监控指标值. -t,表示写入监控数据的类型. -u,表示监控数据的单位. -d,表示监控指标的存活时间. -c,用于指定ganglia配置文件的位置. -S,表示伪装客户端信息,8.8.8.8代表伪装的客户端地址,cloud1代表被监控主机的主机名. 2、python扩展插件现成可用扩展插件: https://github.com/ganglia/gmond_python_modules 五、Ganglia的优势与注意事项(编辑:ASP站长网) |