大家好,经过2个月的开发,夜莺v4来了,欢迎大家试用。本文为大家介绍一下开发v4的背景、最新模块组成、升级建议,同时演示一下单机快速部署的方式。如果朋友是第一次尝试夜莺,可以按照后面讲解的部署方式来搞,5分钟搞定。

演进背景

v3版本融入了很多运维平台的功能,组件变多,部署麻烦,不同的组件相互之间有调用关系,在做分布式部署的时候需要了解整体架构才能正确修改配置文件,对用户提出了较高的要求。很多issue和群里的讨论,都反映出了这个复杂性问题。

我们希望降低这个复杂度,所以,把众多服务端模块做了合并。这样原来组件之间的调用都变成了进程内部的方法调用,可靠性性能都会提升。

新的架构

模块合并之后,把时序存储抽离,总共只剩3个组件:server、prober、agentd。

服务端就是部署server模块,如果要集群部署,就搞2个机器,每个机器分别部署server模块即可。每个server会使用本机的redis,所以,有几个server就部署几个redis,redis只需监听在127.0.0.1,供本机的server使用即可。

prober是个中心式探针,比如贵司有2个网络区域,每个网络区域可以部署一个prober,用此prober采集监控本区域的数据库中间件。如果担心prober挂掉,每个区域可以部署多个prober做高可用。不同网络区域的prober,有个配置要注意,即:report.region字段,比如有bj和gz两个网络区域,每个网络区域分别部署了2台prober,bj的2台prober,report.region要设置为bj,gz的2台prober,report.region要设置为gz。最后,在server.yml里修改monapi.region字段,配上bj和gz。

如果网络是可以互联互通的,那就简单了,prober和server混部即可,都放到中心。

agentd是部署到所有目标机器的,采集目标机器的性能指标,在目标机器执行插件之类的,v4版本的agentd与server之间通信只走了server的rpc端口,所以相比v3,开通网络acl要变简单了。

升级建议

如果v2、v3已经玩得很溜了,并且满足贵司的需求,就不建议升级了。当然,如果新版本有些功能特别想要,那就只能升级了。

如果时序库是使用的tsdb+index这个方案,tsdb进程不用动,可以复用v3的,但是index需要升级。tsdb+index这俩模块的代码抽取到了github.com/n9e/n9e-tsdb中了,编译方法和二进制最新地址都可以在这个repo的README中找到。

server.yml默认使用m3作为存储后端,所以,如果使用tsdb+index的方案,需要修改server.yml,把DataSource改成使用tsdb。

不过我个人建议大家尝试一下m3db,容灾、扩容都做的很方便。

快速部署

这里我带着大家部署一个单机版本的夜莺v4,请大家提前准备好mysql、redis、nginx,单机部署,直接yum安装即可,非常简便。请找一台干净的机器测试!

1、下载二进制

mkdir -p /home/n9e
cd /home/n9e
wget http://116.85.64.82/n9e-4.0.0.tar.gz
tar zxvf n9e.tar.gz

2、初始化数据库,这里假设使用 root 账号,密码为 1234,如果不是这个账号密码,需要修改 /home/n9e/etc/mysql.yml

cd /home/n9e/sql
mysql -uroot -p1234 < n9e_ams.sql
mysql -uroot -p1234 < n9e_hbs.sql
mysql -uroot -p1234 < n9e_job.sql
mysql -uroot -p1234 < n9e_mon.sql
mysql -uroot -p1234 < n9e_rdb.sql

3、redis请不要配置密码, 如果redis设置了密码,需要修改/home/n9e/etc/server.yml,把密码改对

4、下载前端静态资源文件,放到/home/n9e下,请不要随意更换目录结构,否则还要自行修改nginx.conf,徒增烦恼

cd /home/n9e
wget http://116.85.64.82/pub-3.5.2.tar.gz
tar zxvf pub.tar.gz

5、覆盖nginx.conf。如果静态资源文件不是放到/home/n9e下的,就要先修改nginx.conf了

cp etc/nginx.conf /etc/nginx/nginx.conf
systemctl restart nginx

6、时序数据存储部署,这里选择使用单机版本的m3db
mkdir -p /home/m3db

cd /home/m3db
wget https://s3-gz01.didistatic.com/n9e-pub/tarball/m3dbnode-single-v0.0.1.tar.gztar zxvf m3dbnode-single-v0.0.1.tar.gz
cd m3dbnode-single
./scripts/install.sh# retentionTime 表示历史监控数据存储时长,使用m3一般建议最长不要超过3个月
curl -X POST http://localhost:7201/api/v1/database/create -d '{"type": "local","namespaceName": "default","retentionTime": "48h"
}'

7、最后一步,启动相关进程。即可访问nginx看效果了

cd /home/n9e
./control start server
./control start prober
./control start agentd

效果图如下:

滴滴夜莺GitHub:https://z.didi.cn/42A2q

滴滴Logi-KafkaMannager Github:https://z.didi.cn/4xDAM

滴滴Logi-KafkaMannager 是配合滴滴夜莺使用的,面向Kafka用户、Kafka运维人员打造的共享多租户Kafka云平台,专注于Kafka资源申请、运维管控、监控告警、资源治理等核心场景。

如果搭建过程遇到问题,可以加小助手微信,注明“夜莺加群”,“Logi加群”小助手将您拉入网友互助交流群。

滴滴夜莺V4发布,运维监控之利器!相关推荐

  1. 滴滴高级专家工程师保姆级运维监控科普(二)

    监控指标的完备程度,是衡量一个监控系统优劣的重要因素.指标不仅是个名称+数值,更蕴含了目标监控对象的领域知识,理解指标,会加深对目标领域的认知.--晓辉说. 前言 很多用户来问,这个指标是什么意思,那 ...

  2. 部署N9e-v3运维监控平台

    文章目录 1. 夜莺介绍 2. Nightingale架构 3. 安装步骤 4. 子系统简介 5. 用户资源中心 6. 资产管理系统 7. 任务执行中心 8. 监控告警系统 1. 夜莺介绍 官网:ht ...

  3. mongodb 监控权限_运维监控产品分析篇

    开源运维监控系统篇 1.zabbix 用户群:85%以上的泛互联网企业. 优点:支持多平台的企业级分布式开源监控软件 安装部署简单,多种数据采集插件灵活集成 功能强大,可实现复杂多条件告警, 自带画图 ...

  4. python 运维管理架构_企业运维监控平台架构设计与实现(ganglia篇)

    一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...

  5. 开源运维管理软件排名_企业运维监控平台架构设计与实现(ganglia篇)

    一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...

  6. Kafka教程(一)基础入门:基本概念、安装部署、运维监控、命令行使用

    Kafka教程(一)基础入门 1.基本概念 背景 领英->Apache 分布式.消息发布订阅系统 角色 存储系统 消息系统 流处理平台-Kafka Streaming 特点 高吞吐.低延迟 cg ...

  7. 运维自动化(一)----运维监控

    ​ 我们的生活里,离不开监控,监控能够最大程度上,发挥如下作用, 实时监测,即使你不在电脑前,也能实时掌握监控区域情况,提高工作效率. 事后录像查询,如果不法事件未能即使发现制止,可以调取录像,让不法 ...

  8. 常用的17个运维监控系统

    1. Zabbix Zabbix 作为企业级的网络监控工具,通过从服务器,虚拟机和网络设备收集的数据提供实时监控,自动发现,映射和可扩展等功能. Zabbix的企业级监控软件为用户提供内置的Java应 ...

  9. linux运维管理之监控,Linux系统运维之运维监控.pdf

    <Linux 系统运维之运维监控> Linux系统运维之运维监控 Linux系统运维之运维监控 LLiinnuuxx系系统统运运维维之之运运维维监监控控 UNIXHOT 运维社区 UNIX ...

最新文章

  1. 关于pyecharts 地图显示添加数据的问题
  2. 百度推出惊雷算法,打击快排产业,但重点是这个工具
  3. vue.js源码学习分享(一)
  4. 程序员法律考试笔记(1)-民法基本规定与调整范围
  5. 护士计算机等级考试报名时间2015,湖南大学2015年9月全国计算机等级考试报名时间...
  6. linux刷windows要重新校色吗,ThinkPad T470s 在 openSUSE KDE 桌面环境中安装显示器校色文件...
  7. excel同一单元格怎么换行_excel表格内怎么换行 方法有两种 一看就会 新手教程...
  8. PJMEDIA之录音器的使用(capture sound to avi file)
  9. java 递归调整为队列
  10. 作者:黄宜华,南京大学计算机系教授、博士生导师,中国计算机学会大数据专家委员会委员、副秘书长。...
  11. 【渝粤教育】电大中专跨境电子商务理论与实务 (30)作业 题库
  12. 2014年10月30日-----SQL的基础知识
  13. 富勒wms系统里的定时器id_为什么物流行业非常推崇仓库管理系统?
  14. Mac安装Python并使用GUI界面设计
  15. 锂离子电池知多少——①正极材料
  16. AD7705在STM32F103RBT6上的移植[硬件SPI]
  17. l36h android os,Sony Xperia Z(L36h)怎么刷魅族Flyme OS
  18. Mr.Captain东:HTML+CSS+CSS3
  19. 【转】O'Reilly Java系列书籍建议阅读顺序(转自蔡学庸)
  20. 【H264解析Demo】10、变换量化_3_反变换

热门文章

  1. 浅谈线性结构和非线性结构的区别
  2. Linq中的高级用法
  3. 苹果怎么取消自动续费?官方给的取消流程,速看!
  4. 如何在MS Office应用程序中嵌入VP在线图?
  5. 电脑语音设置修复计算机,win10系统麦克风正确设置的恢复办法
  6. 老子的软件之道 - 道篇 11 无之大用
  7. Minecraft 1.18 指令教程
  8. 字节数组转换为字符串会造成数据损失的一些解释
  9. 基于Android的中小学家校互动平台的设计与实现
  10. MyBatis 注解实现动态SQL