Nagios+zabbix+ganglia的相关参数分析和优缺点介绍
最近开始接触Linux运维,安装了Nagios,zabbix和ganglia三种监控工具并使用了一周后总结出一些优缺点,这里贴出来以供参考
Nagios是一款开源的企业级监控系统,能够实现对系统CPU、磁盘、网络等方面参数的基本系统监控,以及SMTP,POP3,HTTP,NNTP等各种基本的服务类型。另外通过安装插件和编写监控脚本,用户可以实现应用监控,并针对大量的监控主机和多个对象部署层次化监控架构。
Nagios本身不提供监控功能,所有的监控功能都要考插件实现,需要在被监控机上安装agent插件
Nagios的功能
添加设备 |
通过修改监控节点的配置文件 |
自动发现设备 |
不能,需要添加新插件 |
发现接口 |
通过修改配置文件 |
数据库 |
不支持SQL数据库 |
服务端口 |
通过插件支持TCP和UDP协议 |
发现应用 |
通过ssh 或插件 |
是否支持NRPE |
支持 |
SNMP协议版本 |
支持V1,2,3 |
Nagios的优缺点
优点 |
缺点 |
稳定的系统管理代码 |
没有自动发现的功能,需要修改配置文件 |
可以监控很多协议,邮件和短信通知 |
只能在终端进行配置,不方便扩展,可读性比较差 |
使用命令加载配置文件,不用打扰Nagios的运行 |
没有简单的方法接收解释SNMP陷阱 |
良好的文档库 |
没有MIB编译器或浏览器 |
出错的服务器,应用和设置会自动重启,自动日志滚动 |
时间控制台功能弱,插件易用性差 |
配置灵活,可以自定义shell脚本,通过分布式监控模式 |
对性能和流量等指标的处理比较差 |
没有历史数据,只能实时报警,出错后难以追查故障原因 |
Nagios的界面比较清爽,功能主要靠插件实现,所以安装比较容易,可以根据自己的需求定制插件的安装,但在被监听端要进行配置,而且出错后没有历史记录可以查看很难找到出错原因,所以不推荐使用
Zabbix的主要特点:
优点:
l 安装与配置简单,学习成本低- 支持多语言(包括中文)
l 自动发现服务器与网络设备
l 分布式监视以及WEB集中管理功能
l 可以无agent监视
l 用户安全认证和柔软的授权方式
l 通过WEB界面设置或查看监视结果
l smtp等报警通知功能
l 支持多平台的企业级分布式开源监控软件
l 安装部署简单,多种数据采集插件灵活集成
l 功能强大,可实现复杂多条件告警,
l 自带画图功能,得到的数据可以绘成图形
l 提供多种API接口,支持调用脚本
l 出现问题时可自动远程执行命令(需对agent设置执行权限)
缺点:
l 项目批量修改不方便
l 社区虽然成熟,但是中文资料相对较少,服务支持有限;
l 入门容易,能实现基础的监控,但是深层次需求需要非常熟悉Zabbix并进行大量的二次定制开发,难度较大;
l 系统级别报警设置相对比较多,如果不筛选的话报警邮件会很多;并且自定义的项目报警需要自己设置,过程比较繁琐;
l 缺少数据汇总功能,如无法查看一组服务器平均值,需进行二次开发;
l 数据报表需要特殊二次开发定义;
Ganglia
简介
• ganglia是UC Berkeley发起的一个开源集群监视项目,设计用于测量和监控数以千计的节点。
• 主要是用来监控系统性能,如:cpu 、内存、硬盘使用率, I/O负载、网络流量情况等。
• ganglia采用多层次的结构模式,使得 ganglia 可以实现良好的扩展。
• gmond 带来的系统负载非常少,这使得它成为在集群中各台计算机上运行的一段代码,而不会影响用户性能。
ganglia 监控套件主要包括三个主要部分:
— gmond
— gmetad
— web接口,通常被称为ganglia-web。
(1) gmond :运行在每一个需要监测的节点上,收集监测统计,发送和接收在同一个组播或单播通道上的统计信息。
如果作为发送者(mute=no),会收集基本指标,比如系统负载(load_one),CPU利用率。
如果作为接收者(deaf=no),会聚合所有从别的主机上发来的指标,并把它们都保存在内存缓冲区中。
(2)gmetad:运行在server端,它会定期检查gmond,从那里拉取数据,并将他们的指标存储在RRD存储引擎中。也可以查询多个集群并聚合指标。
(3) ganglia-web :一般安装在有gmetad运行的机器上,以便读取RRD文件。
浏览web页面时调用php脚本,从RRDTool数据库中抓取信息,动态的生成各类性能监控图表。
用户群:适用于大型服务器集群用户。
(1)优点:
1. 适合监控系统性能,通过曲线很容易见到每个节点的工作状态
2. 可以自定义监控项,监控展示有表格和图像两种,支持手机版
3. 部署方便,通过不同的分层管理上万台机器,无需逐个添加配置,有利于后期的大规模扩张。
4. Ganglia的强大在于:ganglia服务端能够通过一台客户端收集到同一个网段的所有客户端的数据,ganglia集群服务端能够通过一台服务端收集到它下属的所有客户端数据。这个体系设计表示一台服务器能够通过不同的分层能够管理上万台机器。这个功能是其他mrtg,nagios,cacti所不能比拟。
5.Ganglia相比zabbix的优势在于客户端收集agent(gmond)所带来的系统开销非常低,不会影响相关服务的性能。
6. Ganglia的扩展插件非常好写,无论用何种语言(shell,php,pyton)都可以写,只要把最终结果传给gmetric就可以,这样在web上就可以看到对应的数据。
(2)缺点:
1. 没有内置的消息通知系统
2. 没有报警机制,出现问题不能够及时报警
转载自https://blog.csdn.net/messiaDemo/article/details/52046822
Nagios+zabbix+ganglia的相关参数分析和优缺点介绍相关推荐
- 艾美捷人β2微球蛋白是什么?—相关参数分析
什么是β2微球蛋白? β2微球蛋白是由淋巴细胞.血小板.多形核白细胞产生的一种小分子球蛋白,广泛存在于血浆.尿液.脑脊液.唾液以及初乳中.分子质量为11800,由99个氨基酸组成的单链多肽.它是细胞表 ...
- 【运维监控】四款云服务监控工具介绍:Nagios 、 ganglia、zabbix、onealert
在我们日常的工作中,有时候需要监控和管理平台的运行状况,而服务运行是否存在异常,是否有软硬件bug等,均需要第一时间知道.对服务状态了如指掌,是一个很重要的事情.那么这个如何做到呢,我们之前在进行私有 ...
- ST电机库v5.4.4源代码分析(6): PID以及相关参数
编者:沉尸 (5912129@qq.com) 前言: 本文章探索st电机库自动生成的PID参数的由来,采用的控制板为野火407电机板+BLDC带Hall的电机. 在"Mcboot()&quo ...
- 云计算平台管理的三大利器Nagios、Ganglia和Splunk
综合利用Nagios.Ganglia和Splunk搭建起的云计算平台监控体系,具备错误报警.性能调优.问题追踪和自动生成运维报表的功能.有了这套系统,就可轻松管理Hadoop/HBase云计算平台. ...
- 云计算管理三利器:Nagios、Ganglia和Splunk
概述 我们在搭建趋势云计算平台时,遇到了很多的问题和挑战.开始搭建时,第一次来了那么多性能强劲的机器,我们在感到兴奋的同时,也不免有些顾虑.大家坐在一起讨论,问题就列了满满一白板. 出了问题怎么办,有 ...
- 深入理解Java虚拟机-常用vm参数分析
Java虚拟机深入理解系列全部文章更新中- 深入理解Java虚拟机-Java内存区域透彻分析 深入理解Java虚拟机-常用vm参数分析 深入理解Java虚拟机-JVM内存分配与回收策略原理,从此告别J ...
- Linux内核参数(如kernel.shmmax)及Oracle相关参数调整(如SGA_MAX_SIZE)
Linux内核参数(如kernel.shmmax)及Oracle相关参数调整(如SGA_MAX_SIZE) 我们一般在Linux 上安装 设置Oracle 数据库 或者在更换或升级硬件的时候都需要配置 ...
- (116)FPGA面试题-FIFO相关参数与信号,为什么要用格雷码
1.1 FPGA面试题-FIFO相关参数与信号,为什么要用格雷码 1.1.1 本节目录 1)本节目录: 2)本节引言: 3)FPGA简介: 4)FPGA面试题-FIFO相关参数与信号,为什么要用格雷码 ...
- nagios整合ganglia实现hadoop、Hbase监控及手机短信报警
预计该博文篇幅较长,这里不再废话,对ganglia不太了解的去问谷老师,直接看环境: hadoop1.updb.com 192.168.0.101 hadoop2.updb.com 192 ...
最新文章
- 从网站上扒网页,保存为file文件格式
- 销售易移动CRM助力制造业转型智能制造
- 故障解决:没有未桥接的主机网络适配器
- scipy实现的共轭梯度法以及相关原理图解
- ios新手开发——toast提示和旋转图片加载框
- 在Ubuntu桌面上显示我的电脑等图标
- 基于 abp vNext 和 .NET Core 开发博客项目
- C语言 | 结构体数组
- iOS的主要框架介绍
- python snap7 plc db_python 用Snap7读写西门子PLC中DB块
- 铁路、公路施工企业劳务实名制管理系统解决方案
- 微信服务器IP地址清单
- 7z解压crc错误_rar文件解压缩失败解压末端出现错误的解决方法
- 国内哪里培训python比较好-最好的Python培训机构是哪家?
- Win7远程连接问题:凭据不工作 没有授权此用户账户
- Quectel EC200N-CN 大尺寸物联网首选LTE Cat 1模块[移远通信]
- Java模拟微信抢红包
- 【圆梦名企】4月19日,微众银行—招聘专场,10+岗位JD解读直播预告
- UE4+科大讯飞语音听写2
- Excel怎样操作给单元格添加下拉选项?分享经验!如何给Excel单元格加入下拉列表?
热门文章
- 【Teradata SQL】禁用和启用数据库用户登录
- 如何在idea中调试spring bean
- 后台系统应该具备的素养
- Netty实战一之异步和事件驱动
- android -------- 解决NDK开发中的 Method 'NewStringUTF' could not be resolved
- 19.Delete Documents-官方文档摘录
- 如何自己写xuetr(一) 每次改变的驱动名和服务名
- C#从入门到精通视频教程(2009年最新)- 视频列表
- 解决content is not allowed in prolog问题
- linux 内核同步--理解原子操作、自旋锁、信号量(可睡眠)、读写锁、RCU锁、PER_CPU变量、内存屏障