目前常见的技术框架,部分列举如下:

文件存储:Hadoop HDFS、Tachyon、KFS

离线计算:Hadoop MapReduce、Spark

流式、实时计算:Storm、Spark Streaming、S4、Heron

K-V、NOSQL数据库:HBase、Redis、MongoDB

资源管理:YARN、Mesos

日志收集:Flume、Scribe、Logstash、Kibana

消息系统:Kafka、StormMQ、ZeroMQ、RabbitMQ

查询分析:Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Flink、Kylin、Druid

分布式协调服务:Zookeeper

集群管理与监控:Ambari、Ganglia、Nagios、Cloudera Manager

数据挖掘、机器学习:Mahout、Spark MLLib

数据同步:Sqoop

任务调度:Oozie

后续持续更新。。。。。。

常见的大数据框架技术总结相关推荐

  1. 现行大数据框架技术思想鼻祖--不得不看的Google三大论文(英文原文)

    GFS:http://download.csdn.net/detail/myaoyou/9688736 MapReduce:http://download.csdn.net/detail/myaoyo ...

  2. 大数据OLAP技术体系学习框架

    文章目录 大数据OLAP技术体系学习框架 前言 一.Apache Druid分布式数据存储 二.ClickHouse列式数据库 三.Presto分布式查询引擎 四.Kudu分布式存储库 五.Kylin ...

  3. 大数据可视化技术面临的挑战及应对措施

    来源:科技导报 本文约5400字,建议阅读10分钟 本文介绍了适用于大数据的数据可视化技术,讨论了针对大数据可视化应用需求自主研发的交互式可视化设计平台AutoVis及其应用. [ 导读 ]本文从大数 ...

  4. 大数据框架对比:Hadoop、Storm、Samza、Spark和Flink——flink支持SQL,待看

    简介 大数据是收集.整理.处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称.虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性.规模,以及价值在最近几年才 ...

  5. 常见的大数据误区有哪些

    大数据对所有企业都有合理的承诺,无论其规模如何.通过大数据分析,企业可以获得洞察力,帮助他们不仅可以增加收入,还可以了解他们的服务和产品中的差距. 让我们来看看最常见的大数据误区 作为一项不断发展的技 ...

  6. 大数据工程师技术栈探讨

    1.前言 随着国务院印发十四五规划关于数字经济规划和数字信息化建设的推进(如下图1所示).大量的数字化的产品将产生海量的数据,因此近些年大数据技术越来越被大家重视起来. 图1  国务院十四五数字经济规 ...

  7. 视频教程-大数据搜索技术-大数据

    大数据搜索技术 软通动力教育集团简称软通大学,依托软通动力在技术服务领域的多方位解决方案能力,采用先进的教学理念和模式,直通高校和城市,开展干部培养,文化落地,初级资源培训,培训需求对接,专业项目课程 ...

  8. 玩转人工智能(3)常用的大数据框架简单介绍

    时光不老,我们不散. 讲大数据框架前,简单的介绍下大数据的文化.信息时代人类社会的进步得益于分享和开源.大数据时代属于信息时代的第三代发展阶段(2001年到2011年可以认为是CT行业的黄金期,200 ...

  9. 大数据分析师 - 技术体系 - 了解篇

    来自知乎:https://www.zhihu.com/question/49291394    大数据技术体系太庞杂了,基础技术覆盖 数据采集. 数据预处理. 分布式存储. NOSQL数据库. 多模式 ...

最新文章

  1. Ubuntu安装软件失败
  2. yunfile php,【转载】Typecho又拍云文件管理插件UpyunFile升级
  3. 读CSS DIV网页样式与布局心得体会
  4. 论文笔记 Spectral Regularization Algorithms for Learning Large IncompleteMatrices (soft-impute)
  5. android 设置点击ProgressDialog外的区域不消失
  6. mmdnn tensorflow 转 caffe
  7. 5-输入输出系统IO
  8. 2020年前端招聘技术概览
  9. akka kafka java_当使用websocket连接时,使用akka-stream-kafka从kafka主题获取最后一条消息...
  10. Redis-6.2.5 安装 Linux环境(单机)
  11. SAP License:由师姐的包包所想到如何能够掌握客户的需求
  12. 贝叶斯推理(Bayes Reasoning)、独立与因式分解
  13. 总结几个 C 语言知识点
  14. 微信开发者工具在C盘下User Data有啥用,能删掉吗?占用空间超大
  15. VMware安装win10:需win10虚拟机专用镜像,不是真机装系统的ISO镜像
  16. 高速电路逻辑电平转换设计
  17. 小巫随笔12(致小巫逝去的童年)
  18. 新闻稿标题写作中的四大技巧
  19. [论文解读]NBDT: Neural-Backed Decision Trees
  20. 【平面图理论】平面图学习笔记

热门文章

  1. oracle adf lov,Oracle ADF之 LOV 级联下拉菜单
  2. CPU热测试_经验案例
  3. 怎么才能更好的提高员工信息安全意识??????
  4. 压缩文件打开时乱码怎么办
  5. 谢谢,那些伤害过我的人:伤感日志
  6. 360浏览器:一键恢复收藏夹
  7. “新基建”呼唤数据中心“整合者”
  8. 新倩女幽魂服务器最多,新倩女幽魂哪个区人最多_2020倩女幽魂哪个区人多
  9. 数据治理系列3:数据标准管理
  10. mos管寄生二极管的作用