最终搭建完成成品监控效果如图所示

夜莺是一套分布式高可用的运维监控系统,最大的特点是混合云支持,既可以支持传统物理机虚拟机的场景,也可以支持K8S容器的场景。同时,夜莺也不只是监控,还有一部分CMDB的能力、自动化运维的能力,很多公司都基于夜莺开发自己公司的运维平台。重点是部署方便快捷,相比目前主流的监控系统zabbix和Prometheus有自己的优势。更适合国人的操作习惯和体验,有着许多大公司线上环境的最佳实践,如美团,滴滴等等

官方地址

https://github.com/didi/nightingale

夜莺运维平台是滴滴开源的一个运维平台有着滴滴公司最佳实践
夜莺拆成了四个子系统,分别是:
用户资源中心(RDB)、
资产管理系统(AMS)、
任务执行中心(JOB)
监控告警系统(MON)
具体介绍请看官网,这里重点说明下部署步骤
我这里采用的docker部署

第一步github拉取代码镜像到服务器指定位置


也可以去http://116.85.64.82/ 拉取最新版本的tar包

拉取完成如图所示

第二步配置启动项

下载docker-compose

curl -L https://github.com/docker/compose/releases/download/1.25.0-rc4/docker-compose-`uname -s`-`uname -m` -o /usr/local/bin/docker-compose
chmod  +x  /usr/local/bin/docker-compose

利用docker-compose下载生成并启动镜像
cd /home/yeying-master/nightingale-master/dockerfiles
docker-compose up #启动
启动完成docker ps 会生成如图所示四个容器

注意端口不要被占用,否则无法正常启动

若无报错则可正常访问


初始账号密码为 root root.2020
至此 master节点搭建完成

第三步配置node节点

wget http://116.85.64.82/n9e.tar.gz
tar -xf n9e.tar.gz
解压后如图所示

[root@yeyin-master ~]# ll
-rwxr-xr-x. 1 root root     3065 10月  9 23:02 control
drwxr-xr-x. 4 root root     4096 10月  9 23:03 etc
-rwxr-xr-x. 1 root root 22834094 10月  8 19:50 n9e-agent
-rwxr-xr-x. 1 root root 20181862 10月  8 19:50 n9e-ams
-rwxr-xr-x. 1 root root 22098532 10月  8 19:50 n9e-index
-rwxr-xr-x. 1 root root 20610070 10月  8 19:50 n9e-job
-rwxr-xr-x. 1 root root 22062651 10月  8 19:50 n9e-judge
-rwxr-xr-x. 1 root root 22890758 10月  8 19:49 n9e-monapi
-rwxr-xr-x. 1 root root 23874802 10月  9 22:49 n9e-rdb
-rw-r--r--. 1 root root 97333889 10月  9 23:03 n9e.tar.gz
-rwxr-xr-x. 1 root root 23887629 10月  8 19:50 n9e-transfer
-rwxr-xr-x. 1 root root 20424816 10月  8 19:50 n9e-tsdb
drwxr-xr-x. 2 root root      101 9月  28 10:07 sql

将 control n9e-agent /etc/address.yml /etc/agent.yml /etc/identity.yml 打包 拷贝到/home/n9e/
如图所示

修改配置文件
vim address.yml
将全局192.168.106.132改成master节点的主机的ip

 :%s/192.168.106.132/ip/g

配置开机自启服务

vim     /usr/lib/systemd/system/agent.service
Description=n9e agent
After=network-online.target
Wants=network-online.target[Service]
# modify when  deploy  in prod env
User=root
Group=rootType=simple
Environment="GIN_MODE=release"
ExecStart=/home/n9e/n9e-agent
WorkingDirectory=/home/n9eRestart=always
RestartSec=1
StartLimitInterval=0[Install]
WantedBy=multi-user.target

systemctl restart agent
systemctl enable agent
检查无报错说明启动正常
systemctl status agent

进入web平台

即可看到刚才添加的node节点的主机信息

选择游离资源-挂载资源,将相应的服务器挂载到相应的项目目录下

选择组织资源树-选择相应的项目

能够看到刚才挂载的相应系统

任务执行中心可以批量执行任务,将相应的任务提前创建好,便于相应节点来批量执行任务

用户中心可以批量加入服务器

监控大盘可以产看相应的服务器监控内容,这点还是比较直观的

告警策略可以根据自己的需求配置

报警支持 邮件,钉钉,和企业微信


编写脚本启动程序

 cat start.sh
#!/bin/bash
#
sh  /home/n9e/control start all
systemctl  restart  redis
systemctl  restart  mariadb
ps -ef | grep  nginx  | grep  master  |awk '{print$2}'  |xargs kill
nginx
echo "服务启动成功"

yeyin配合grafana做展示平台

wget https://dl.grafana.com/oss/release/grafana-7.3.2-1.x86_64.rpm
sudo rpm -i --nodeps grafana-7.3.2-1.x86_64.rpm
systemctl start  grafana-server.service
systemctl status grafana-server.service

####将n9e插件加入到grafana中
grafana-cli --pluginUrl https://github.com/n9e/grafana-n9e-datasource/archive/v1.5.3.zip plugins install grafana-n9e-datasource
systemctl restart grafana-server.service #重启服务
访问该地址 http://192.168.106.132:3000/

初始账号密码 admin/admin


具体配置如下

然后配置你想要添加的图标显示想要监控的内容

最终能够呈现的效果如图所示的看板监控

三分钟构建自动化运维平台-nightingale(夜莺)相关推荐

  1. 使用flask从零构建自动化运维平台系列三

    文章目录 Angularjs inspina 登录界面 登录界面代码 关于Angularjs的一些解答 认证服务 禁止没登录去访问页面 angularjs自己的路由 angularjs自己的控制器 怎 ...

  2. 小米自动化运维平台演进设计思路

    嘉宾 | 孙寅 编辑 | 张婵 小米自动化运维平台建设大致分为三个时期,整体建设的规划比较清晰,能够一以贯之.本文介绍了小米自动化运维平台的演进思路. 现如今,随着云计算和分布式的落地和发展,越来越多 ...

  3. 从 OpenStack 到 Mesos 再到 Kubernetes, 携程容器云自动化运维平台实践\n

    随着虚拟化技术和云计算技术的普及,IT互联网基础设施发生了很大的变化,底层的计算.存储.网络等资源也越来越复杂,需要有平台能管理好这些资源,尽量将工作流程自动化,将运维人员从繁重的手动工作中解救出来. ...

  4. 京东物流系统自动化运维平台技术揭密

    作者:赵玉开,十年以上互联网研发经验,2013年加入京东,在运营研发部任架构师,期间先后主持了物流系统自动化运维平台.青龙数据监控系统和物流开放平台的研发工作,具有丰富的物流系统业务和架构经验.在此之 ...

  5. 成熟的自动化运维平台是怎样练成的?

    当遇到运维管理对象的急速增长,业务需求频繁变更等传统运维场景问题时,依靠手工运维已经远远满足不了需求,因此我们需要搭建一套自动化运维平台,来实现运维质量和效率的提升.那么一个成熟的自动化运维平台是什么 ...

  6. 做好自动化运维平台需要哪些技能?

    俗话说"万丈高楼平地起",同样的道理,想要搭建一个强大的自动化运维平台,那么基础技能自然是少不了的,而且基础数据就是它的地基,稳不稳还要看基础数据好不好,而这就关乎到技术的技能了, ...

  7. Ansible 企业级自动化运维平台开发实战

    一.运维开发 普通的运维方式:使用Xshell或者脚本去操作服务器. 运维开发的方式:可以实现把运维的工作Web化. 运维开发优点:可以把运维工作简单化.运维工作规划化. 运维开发: 负责具体的产品的 ...

  8. ducter运维平台_开源自动运维管理平台_自动化运维平台 开源

    专访运维管理开源平台负责人刁文波:Ducter能 550x364 - 47KB - JPEG 专访运维管理开源平台负责人刁文波:Ducter能 550x381 - 45KB - JPEG 光宇游戏黄振 ...

  9. 做好自动化运维平台必备技能

    万丈高楼平地起,高楼稳不稳取决于地基是否扎实.基础数据便是运维管理这座高楼的地基. 首先介绍一下我们在运维管理中所涉及到的基础数据有哪一些.请看下图: 基础数据大致分为CMDB.日志.生产DB.知识库 ...

最新文章

  1. 【文本分类】Recurrent Convolutional Neural Networks for Text Classification
  2. python 2: 解决python中的plot函数的图例legend不能显示中文问题
  3. python爬虫数据分析可以做什么-python爬虫爬取的数据可以做什么
  4. 直接在Dao层进行测试的问题
  5. mysql rpm 安装后修改路径_mysql rpm包安装后修改数据目录
  6. PWM实现语音播放原理
  7. 笨方法“学习python笔记之print换行
  8. 深度学习(七十三)pytorch学习笔记
  9. flume1.8实现hdfsSink整点滚动文件
  10. r语言 col_R语言: GARCH模型股票交易量的研究道琼斯股票市场指数
  11. 小苏的Shell编程笔记之六--Shell中的函数
  12. python环境下数据操作_在windows环境下使用Python操作spatialite数据库
  13. Win10 监控小软件
  14. matlab两矩阵相似性,两个矩阵同时相似对角化MATLAB程序.docx
  15. [NSSCTF][SCTF 2021]WEB复现
  16. 代码编辑器--5.21
  17. 大唐波斯将军 机器人_波斯帝国被阿拉伯所灭,末代王子三次求助大唐,为何唐朝没有出兵?...
  18. SC4020/SCv2020 控制器更换流程步骤和可能遇到的问题
  19. python微信加人_Python微信机器人自动添加好友自动回复
  20. 远景阿波罗光伏助力苹果供应商清洁能源计划

热门文章

  1. Spring Boot进阶(40):实现文件批量导出到zip压缩包并本地下载 | 超级详细,建议收藏
  2. 基于蒙哥马利实现大数模密的算法的硬件实现
  3. 化工热力学(第三版)答案陈
  4. Android语音转文字一识别语音
  5. 摄影测量-笔记(理解篇)
  6. 杭州少年科学院计算机编程社,号外 | 少年科学院成立了!
  7. 如何提取ipa中的图片; iphone ios 如何制作越狱ipa安装文件
  8. 七年级上册计算机工作总结,七年级上学期年级组工作总结
  9. ②读后感之《如何阅读一本书》 莫提默.J.艾德勒【美】
  10. 个股期权什么意思?场外个股期权又是什么?