1. How did it all start- huge data on the web!
  2. Nutch built to crawl this web data
  3. Huge data had to saved- HDFS was born!
  4. How to use this data?
  5. Map reduce framework built for coding and running analytics – java, any language-streaming/pipes
  6. How to get in unstructured data – Web logs, Click streams, Apache logs, Server logs  – fuse,webdav, chukwa, flume, Scribe
  7. Hiho and sqoop for loading data into HDFS – RDBMS can join the Hadoop band wagon!
  8. High level interfaces required over low level map reduce programming– Pig, Hive, Jaql
  9. BI tools with advanced UI reporting- drilldown etc- Intellicus
  10. Workflow tools over Map-Reduce processes and High level languages
  11. Monitor and manage hadoop, run jobs/hive, view HDFS – high level view- Hue, karmasphere, eclipse plugin, cacti, ganglia
  12. Support frameworks- Avro (Serialization), Zookeeper (Coordination)
  13. More High level interfaces/uses- Mahout, Elastic map Reduce
  14. OLTP- also possible – Hbase

转载于:https://www.cnblogs.com/AloneSword/p/3789835.html

Hadoop ecosystem相关推荐

  1. Hadoop Ecosystem解决方案---数据仓库

    个人总结的一套基于hadoop的海量数据挖掘的开源解决方案. BI系统: Pentaho pentaho是开源的BI系统中做得算顶尖的了. 提供的核心功能如下:     报表功能: 可视化(clien ...

  2. Hadoop生态圈一览

    根据Hadoop官网的相关介绍和实际使用中的软件集,将Hadoop生态圈的主要软件工具简单介绍下,拓展对整个Hadoop生态圈的了解. 这是Hadoop生态从Google的三篇论文开始的发展历程,现已 ...

  3. 几篇关于Hadoop+Hive数据仓库的入门文章

    Hadoop计算平台和Hadoop数据仓库的区别 http://datasearch.ruc.edu.cn/~boliangfeng/blog/?tag=%E6%95%B0%E6%8D%AE%E4%B ...

  4. Hadoop体系结构– YARN,HDFS和MapReduce

    Before reading this post, please go through my previous post at "Hadoop 1.x: Architecture and H ...

  5. Hadoop 1.x:体系结构,主要组件以及HDFS和MapReduce的工作方式

    Before reading this post, please go through my previous post at "Introduction to Hadoop" t ...

  6. Hadoop大数据采集

    Hadoop HDFS 1.基于HDFS的云盘系统设计与实现: 1 系统基本功能模块设计 HDFS是一个高度容错性的系统, 它是运行在通用硬件上的分布式文件系统, 适合部署在廉价的机器上.HDFS能提 ...

  7. 大数据概况以及Hadoop生态系统

    一,什么是大数据?     大数据是一个描述大量高速,复杂和可变数据的术语,需要先进的技术来实现信息的捕获,存储,分发,管理和分析.大数据包含四个特性(4v),体量(Volume).速度(Veloci ...

  8. hadoop的组件有哪些

    Apache Hadoop是一个分布式计算系统,它主要由以下几个组件组成: Hadoop Distributed File System(HDFS):这是Hadoop的分布式文件系统,负责存储大量的数 ...

  9. Hadoop 生态圈 ————Hbase数据库

    HBase是一个分布式的,面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".HBase不同于一般的关系 ...

最新文章

  1. c语言编程输入年月日判断是否合法,C语言程序设计:输入年月日判断这是这一年中的第几天...
  2. 浅析arm的异常、中断和arm工作模式的联系
  3. 51单片机除法c语言,求一个 89C51 简易计算器的c语言程序 只要加减乘除就行!
  4. Android实现系统ROOT, 并能赋予app root权限
  5. 文巾解题 595. 大的国家
  6. CodeForces - 765D Artsem and Saunders(数学化简+构造+思维)
  7. 【小白成长撸】--二分查找
  8. java 树 右键菜单_jQuery实现自定义右键菜单的树状菜单效果
  9. eps提取高程点在哪里_Eps总结(3)——Eps使用点云生成等高线及高程点
  10. PyTorch实现的ResNet50、ResNet101和ResNet152
  11. java运行 .class文件_运行java的class文件方法详解
  12. 如何编辑修改PDF文件内容?修改方法很简单
  13. 卡内基梅隆大学计算机科学博士,卡内基梅隆大学有哪些专业处于世界顶尖水平?...
  14. 《富爸爸穷爸爸》阅读笔记
  15. 不懂设计的产品不是好开发
  16. 读书节最该买的书,我都帮你们挑出来了
  17. Android中的AOP编程之AspectJ实战实现数据埋点
  18. 搞前端开发的比后端多两倍,这意味着哪一个更有前途?
  19. 如何构建企业数据资产运营体系
  20. android 服务检测,Android检测某个服务是否还活着代码

热门文章

  1. 字符串转换 BSTR/LPSTR/LPWSTR/Char
  2. ASP.NET 2.0中母版页中引用文件路径的问题(收集)
  3. 这可能是目前最好的图像超分辨率算法,刚刚开源了
  4. 次世代角色建模的学习流程,软件学习顺序
  5. csv文件python是怎么输入的,python怎么读取和写入csv文件
  6. 【OpenCV】OpenCV函数精讲之 -- 颜色空间缩减及LUT函数
  7. python词云有什么用_使用Python定制词云
  8. 复练-软考高级-论文写作专题
  9. 上海东海学院计算机,上海东海职业技术学院
  10. ionic android绝对定位,Safari中的CSS故障与Ionicons作为背景内容和绝对定位