大数据集群

  • 架构图
    • 说明
    • 可能出现的问题

架构图

根据自己的数据量
1)20核物理CPU 40线程 * 7 = 280线程
内存128g * 7台 = 896g (计算任务内存700g,其他安装框架需要内存)
128m ----1g内存
87g数据 ---- 700g内存
2)根据数据规模搭建集群模拟的10台机器

说明

1)消耗内存的分开;
2)kafka 、zk 、flume 传输数据比较紧密的放在一起;
3)客户端尽量放在一到两台服务器上,方便外部访问;
4)还有就是MySQL,sqoop,azkaban,调度的放在一起;

可能出现的问题

1,由于hadoop集群都配的高可用,总会出现很多问题,注意细心可以;
2,kafka也配的是集群,所有配置等都是要同步的;
3,azkaban也配的是集群,所以hive,sqoop也是的和azkaban一样的数量,这样写好的脚本也是同步到位,免得找不到脚本,找不到路径;
4,zookeeper也是集群,这些都要配置同步,而且一定的注意细心;
有问题可以私下沟通;
为梦而来,不能怂

生产大数据集群架构图相关推荐

  1. 全网最详细的Hadoop大数据集群搭建并进行项目分析(基于完全分布式)---终结篇

    ##所有需要的资料全部已上传到百度网盘上,请自行下载## 获取镜像,https://pan.baidu.com/s/1ho4hMrvIu1V6W4wWdH8nIA,提取码:ygyg 获取Xshell, ...

  2. PPTV之大数据集群容器化研究

    本文讲的是PPTV之大数据集群容器化研究[编者的话]如何统一调度两个集群的物理资源,有效节约成本? 背景 PPTV作为国内视频领域的领先者,对于大规模流媒体的存储.处理.分发及应用,有着迫切的要求.容 ...

  3. 阿里云TSDB在大数据集群监控中的方案与实战

    目前大部分的互联网企业基本上都有搭建自己的大数据集群,为了能更好让我们的大数据集群更加高效安全的工作,一个优秀的监控方案是必不可少的:所以今天给大家带来的这篇文章就是讲阿里云TSDB在上海某大型互联网 ...

  4. 大数据集群跨多版本升级、业务0中断,只因背后有TA

    摘要:2021年4月21日,中国太平洋保险集团联合华为云完成了全球首例大数据集群跨多版本的大数据集群滚动升级. 本文分享自华为云社区<华为云FusionInsight助力太保跨多版本升级业务0中 ...

  5. 一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解

    一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解 "如果你是一个经验丰富的运维开发人员,那么你一定知道ganglia.nagios.zabbix.elastics ...

  6. 大数据集群扩容机架分配

    由于生产上大数据集群时常会扩容,而每次扩容完成后需要对新扩容的主机进行机架分配,涉及主机数量比较多时,通过手工分配耗时较长,因此编写如下脚本进行机架分配. 第一部分:获取集群主机ID/IP地址/机架号 ...

  7. 大数据集群失联问题解决方案

    我们之前维护的集群经常性地出现失联的情况,大数据集群上,还有es集群在跑,在凌晨左右集群会有随机的机器间歇性失联,cpu飙高,ssh登录不了. 在尝试了诸多方法后,通过每天定时清理缓存的方式解决了集群 ...

  8. 大数据集群迁移的那一夜是怎么过的|回忆录

    背景 大数据集群迁移这件事,不知道有多少同学做过(反正我是第一次).我说的不是简单的把一个集群的数据拷贝到另一个集群上,我指的是整个数据处理平台与相关的前台业务的迁移工作,是从一个机房到另一个机房. ...

  9. Hadoop+Spark 大数据集群日常1 (There are 0 datanode(s) running报错 处理)

    Hadoop+Spark 大数据集群日常1 由于项目涉及Hadoop+Spark大数据集群,特写此文档,方便将来处理类似问题参照,也为后人提供解决方案. 本人才疏学浅,文档难免有错漏与不妥之处,欢迎与 ...

  10. 使用ansible部署CDH 5.15.1大数据集群

    使用ansible离线部署CDH 5.15.1大数据集群 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 在此之前,我之前分享过使用shell自定义脚本部署大数据集群,不管是部署CD ...

最新文章

  1. 33. 使用fread()/fwrite()往文件中写入结构体,从文件中读出结构体
  2. Linux下三个密码生成工具
  3. 全球最大AI商业展会开幕,这家老牌巨头担当中国唯一代表
  4. 在DataGridView控件中加入ComboBox下拉列表框的实现
  5. 推荐系统入门:作为Rank系统的推荐系统(协同过滤)
  6. 打开mysql的远程连接_开启mysql的远程访问权限
  7. 织梦dede:channelartlist调用排除指定typeid栏目
  8. python3.8.0安装详细步骤_python3.8.0安装教程_后端开发
  9. poj3159差分约束+栈实现的spfa+邻接链表
  10. 股票市场的本质是为优质企业提供融资的平台
  11. Cabloy-CMS:动静结合,解决Hexo痛点问题
  12. android viewpager原理,ViewPager不为人知的秘密
  13. 侯捷 - C++ Startup 揭密:C++ 程序的生前和死后 (二)
  14. Android studio上音频文件格式问题
  15. 2020 Multi-University Training Contest 6
  16. 如何将大硬盘对拷到小硬盘
  17. Linux root密码重置
  18. 请编写一个程序,使用字典存储学生信息,学生信息包含学号和姓名,请根据学生学号从小到大输出学生信息
  19. 股市第一赌局:百万赌金 侯宁催账叶荣添准备买单
  20. “大脑营养剂”给你好睡眠

热门文章

  1. 1 (msql实战)基础架构
  2. 判断一个数是不是质数(素数)
  3. Spectrum采集卡在飞行时间质谱中的应用案例
  4. 数字逻辑练习题(四)用卡诺图化简下面的函数为最简“与-或”式
  5. 基于VGG的图像多标签分类算法详解及实践
  6. 2019年360笔试
  7. 计算机毕业设计:基于springboot框架开发的办公自动化OA系统
  8. 台式计算机硬盘的尺寸通常为多少英寸,2.5寸硬盘尺寸大小怎么看
  9. oracle 并置,Oracle Coherence中文教程二:安装Oracle Coherence
  10. xtu 1370 ball