轻轻松松监管过万台网络服务器:公司运维管理监管服务平台构

zabbix由2一部分组成,zabbixserver与可选择部件zabbix agent。zabbix server能够根据SNMP,zabbix agent,ping,端口号监控等方式出示对远程控制网络服务器/互联网情况的监控,数据信息搜集等作用,它能够运作在Linux, Solaris, HP-UX, AIX, Free BSD, Open BSD, OS X等服务平台上。

4、ganglia

Ganglia是一款为HPC(性能卓越测算)群集而设计方案的可拓展的遍布式监管系统软件,它能够监控和显示信息群集中的连接点的各种各样情况信息内容,它由运作在每个连接点上的gmond守卫过程来收集CPU 、运行内存、电脑硬盘运用率、I/O负荷、互联网总流量状况等层面的数据信息,随后归纳到gmetad守卫过程下,应用rrdtool储存数据信息,最终将历史时间数据信息以曲线图方法根据PHP网页页面展现。
玉树企业网站建设

Ganglia监管系统软件有三一部分构成,各自是gmond、gmetad、webfrontend。

5、centreon

Centreon是一款作用强劲的遍布式IT监管系统软件,它根据第三方部件能够完成对互联网、实际操作系统软件和运用程序的监管:最先,它是开源系统的,大家能够完全免费应用它;次之,它的最底层选用nagios做为监管手机软件,同时nagios根据ndoutil控制模块将监管到的数据信息定时执行载入数据信息库文件,而Centreon即时从数据信息库载入该数据信息并根据Web页面呈现监管数据信息;最终,大家能够根据Centreon管理方法和配备nagios,或是说Centreon便是nagios的一个管理方法配备专用工具,根据Centreon出示的Web配备页面,能够轻轻松松进行nagios的各种各样繁杂配备。

6、比照图

二、统一运维管理监管服务平台设计方案构思

搭建一个智能化的运维管理监管服务平台,务必以运作监管和常见故障警报这2个层面为关键,将全部业务流程系统软件中常涉及到的互联网資源、硬件配置資源、手机软件資源、数据信息库資源等列入统一的运维管理监管服务平台中,并根据清除管理方法手机软件的区别,数据信息收集方式的区别,对各种各样不一样的数据信息来源于完成统一管理方法、统一标准、统一解决、统一呈现、统一客户登陆、统一管理权限操纵,最后完成运维管理标准化、全自动化、智能化化的大运维管理管理方法。

智能化的运维管理监管服务平台,设计方案构架从低于高能够分成6层,三大控制模块,以下图:

运维管理监管服务平台完成拓扑图,可以看下面的图:

三、Ganglia的安裝

1、ganglia的常见构架

Ganglia监管系统软件有三一部分构成,各自是gmond、gmetad、webfrontend,以下图所显示:

同时,Ganglia适用多种多样监管构架,它是由gmetad的特点决策的,gmetad能够周期时间性地去好几个gmond连接点搜集数据信息,这便是ganglia的双层构架。同时,gmetad不仅能够从gmond搜集数据信息,还可以从别的的gmetad获得数据信息,这就产生了Gnaglia的三层构架。多种多样构架方法也反映了Ganglia做为遍布式监管系统软件的灵便性和拓展性。

2、yum方法安裝ganglia

CentOS系统软件中默认设置的yum源并沒有包括Ganglia,因此大家务必安裝拓展的yum源。从下边这一详细地址免费下载Linux额外手机软件包(EPEL),随后安裝拓展yum源:

进行yum源安裝,便可以立即根据yum方法安裝Ganglia了。

Ganglia的安裝分成2个一部分,各自是gmetad和gmond,gmetad安裝在监管管理方法端,gmond安裝在必须监管的顾客端服务器,相匹配的yum包名字各自为ganglia-gmetad和ganglia-gmond。

下边详细介绍根据yum方法安裝Ganglia的全过程。

下列实际操作是在监管管理方法端开展的,最先根据yum指令查询下能用的Ganglia安裝信息内容:

安裝gmetad必须rrdtool的适用,而根据yum方法,会全自动搜索gmetad依靠的安裝包,全自动进行安裝,这也是yum方法安裝的优点。

最终在必须监管的全部顾客端服务器上安裝gmond服务:

那样,Ganglia监管系统软件就安裝进行了。根据yum方法安裝的Ganglia默认设置配备文档坐落于/etc/ganglia中。

3、Ganglia监管管理方法端配备

监管管理方法端的配备文档是gmetad.conf,这一配备文档內容较为多,可是必须改动的配备唯一以下好多个:

data_source:此主要参数界定了群集姓名,及其群集中的连接点。Cluster1便是这一群集的名字,cloud0和cloud2指出了从这2个连接点搜集数据信息,Cluster1后边特定的连接点名能够是IP详细地址,还可以是服务器名,因为选用了multicast方式,每一个gmond连接点都是有本Cluster1群集连接点全部监管数据信息,因而不用把全部连接点都载入data_source中。可是提议载入不少于两个,那样,在cloud0连接点出現常见故障的情况下,gmetad会全自动到cloud2连接点收集数据信息,那样就确保了Ganglia监管系统软件的高能用性。

data_source:此主要参数界定了群集姓名,及其群集中的连接点。Cluster1便是这一群集的名字,cloud0和cloud2指出了从这2个连接点搜集数据信息,Cluster1后边特定的连接点名能够是IP详细地址,还可以是服务器名,因为选用了multicast方式,每一个gmond连接点都是有本Cluster1群集连接点全部监管数据信息,因而不用把全部连接点都载入data_source中。可是提议载入不少于两个,那样,在cloud0连接点出現常见故障的情况下,gmetad会全自动到cloud2连接点收集数据信息,那样就确保了Ganglia监管系统软件的高能用性。

上边根据data_source主要参数界定了一个网络服务器群集Cluster1,针对要监管好几个运用系统软件的状况,还能够对不一样主要用途的服务器开展排序,界定好几个网络服务器群集,排序方法能够根据下边的方式界定:

能够根据界定好几个data_source来完成监管好几个网络服务器群集,而每一个网络服务器群集在界定群集连接点的情况下,能够选用服务器名或IP详细地址等方式,还可以加端口号,假如不用端口号,默认设置端口号是8649,同时能够设置收集数据信息的頻率,如上边的“10 localhost、50 1.3.4.7:8655”等,各自表明每过10秒左右、50秒左右收集一频次据。

gridname:此主要参数是界定一个网格图名字。一个网格图有好几个网络服务器群集构成,每一个网络服务器群集由“data_source”选择项而定义。

xml_port:此主要参数界定了一个搜集数据信息归纳的互动端口号,假如不特定,默认设置是8651,能够根据telnet这一端口号获得监管管理方法端搜集到的顾客端的全部数据信息。

interactive_port:此主要参数界定了Web端获得数据信息的端口号,这一端口号在配备Ganglia的Web监管页面时要要特定。

rrd_rootdir:此主要参数界定了rrd数据信息库的储放相对路径,gmetad在搜集到监管数据信息之后将其升级到该文件目录下的相匹配的rrd数据信息库文件。

gridname:此主要参数是界定一个网格图名字。一个网格图有好几个网络服务器群集构成,每一个网络服务器群集由“data_source”选择项而定义。

xml_port:此主要参数界定了一个搜集数据信息归纳的互动端口号,假如不特定,默认设置是8651,能够根据telnet这一端口号获得监管管理方法端搜集到的顾客端的全部数据信息。

interactive_port:此主要参数界定了Web端获得数据信息的端口号,这一端口号在配备Ganglia的Web监管页面时要要特定。

rrd_rootdir:此主要参数界定了rrd数据信息库的储放相对路径,gmetad在搜集到监管数据信息之后将其升级到该文件目录下的相匹配的rrd数据信息库文件。

4、Ganglia的顾客端配备

Ganglia监管顾客端gmond安裝进行后,配备文档坐落于Ganglia安裝相对路径的etc文件目录下,名字为gmond.conf,这一配备文档略微繁杂,以下所显示:

5、Ganglia web端配备

Ganglia的web监管页面是根据PHP的,因而必须安裝PHP自然环境。

有二种方法安裝Ganglia的web监管页面,一种是yum立即安裝,另外一种是根据源代码安裝。PHP自然环境的安裝这儿不做详细介绍,大伙儿能够在http://sourceforge.net/projects/ganglia/files/免费下载ganglia-web的全新版本号,随后将ganglia-web程序放进Apche Web的网站根目录就可以,这儿大家免费下载的版本号是ganglia-web-3.7.1。

配备Ganglia的Web页面较为简易,只必须改动好多个php文档就可以。最先是conf_default.php,能够将conf_default.php重新命名为conf.php,还可以维持不会改变,Ganglia的Web默认设置先找conf.php,找不着会再次找conf_default.php,必须改动的內容以下:

这儿必须表明的是:“$conf['dwoo_compiled_dir']”和“$conf['dwoo_cache_dir']”特定的相对路径在默认设置状况下将会不会有,因而必须手动式创建compiled和cache文件目录,并授于Linux下“777”的管理权限。此外,rrd数据信息库的储存文件目录/opt/app/ganglia/rrds一定要确保rrdtool可写,因而必须实行受权指令:

那样rrdtool才可以一切正常载入rrd数据信息库,从而将数据信息根据Web页面展现出去。实际上ganglia-web的配备還是较为简易的,一旦配备错误会得出提醒,依据不正确提醒开展难题清查,一般都能寻找处理方式。

四、拓展Ganglia监管作用

1、根据gmetric插口拓展Ganglia监管

gmetric是Ganglia的一个指令行专用工具它能够将数据信息立即推送到承担搜集数据信息的gmond连接点,或是广播节目给全部gmond连接点。

在Ganglia安裝进行后,会在bin文件目录下转化成gmetric指令。下边根据一个案例详细介绍一下gmetric的应用方式:

在其中:

-n,表明要监管的指标值名。

-v,表明载入的监管指标值值。

-t,表明载入监管数据信息的种类。

-u,表明监管数据信息的企业。

-d,表明监管指标值的生存時间。

-c,用以特定ganglia配备文档的部位。

-S,表明掩藏顾客端信息内容,8.8.8.8意味着掩藏的顾客端详细地址,cloud1意味着被监管服务器的服务器名。

2、python拓展软件

现有能用拓展软件:

五、Ganglia的优点与留意事宜

能够轻轻松松监管过万台网络服务器,数据信息廷时在10s之内。

遍布式构架,拓展层面,十分合适各地跨主机房布署。

与centrenon无缝拼接融合,完成监管、警报一体化。

数据信息储存硬盘IO将会变成短板,必须性能卓越硬盘做支撑点。

能够轻轻松松监管过万台网络服务器,数据信息廷时在10s之内。

遍布式构架,拓展层面,十分合适各地跨主机房布署。

与centrenon无缝拼接融合,完成监管、警报一体化。

数据信息储存硬盘IO将会变成短板,必须性能卓越硬盘做支撑点。

创作者详细介绍 高俊峰

网名巴西小蚂蚁,知名Linux权威专家,著名IT文学家;

曾任职于新浪网网、阿里巴巴云(万网),就职系统软件构架师;

有着近十五年一线工作中工作经验,曾出版发行《由浅入深Linux》、《性能卓越Linux网络服务器搭建实战演练》等多本Linux运维管理热销书本。

网名巴西小蚂蚁,知名Linux权威专家,著名IT文学家;

曾任职于新浪网网、阿里巴巴云(万网),就职系统软件构架师;

有着近十五年一线工作中工作经验,曾出版发行《由浅入深Linux》、《性能卓越Linux网络服务器搭建实战演练》等多本Linux运维管理热销书本。

经创作者愿意受权转截

创作者:高俊峰

blog:爱维Linux

最近主题活动:

全世界灵巧运维管理高峰会【北京市站】

2017年6月12日,DBA+社群营销协同运维管理帮、Linux我国打开全世界灵巧运维管理高峰会第二站:北京市站!高峰会力邀来源于百度搜索、新浪网、58进家、小米手机、凡科遨游、浙江省移动、新炬互联网、系统日志易等互连网与传统式公司的杰出达人,聚集500+制造行业精锐!现价169元的门票费特惠特惠价66元(特惠码dbaplus),现价599元的VIP票特惠特惠价399元(特惠码:dbavip)!赶紧登陆高峰会官方网站http://gdevops/抢座吧~

DAMS第二届我国数据信息财产管理方法高峰会

绝大多数据与数据信息财产管理方法行业的榜样性高峰会:第二届我国数据信息财产管理方法高峰会(DAMS 2016, Data Asset Management Summit)将要于8月8号在上海市盛大游戏举行!高峰会具体指导企业:上海市市经济发展和信息内容化委员会会、黄浦区区老百姓政府部门,上海市市云计算技术产业链推动管理中心举办,DBA+社群营销、顶尖技术性官同盟、顶尖数据信息官同盟承办,DAMS举办方和新炬互联网协同协办,数十家新闻媒体企业相互适用。官方网站连接:http://dams.org.cn/

相关阅读