Hadoop ecosystem
- How did it all start- huge data on the web!
- Nutch built to crawl this web data
- Huge data had to saved- HDFS was born!
- How to use this data?
- Map reduce framework built for coding and running analytics – java, any language-streaming/pipes
- How to get in unstructured data – Web logs, Click streams, Apache logs, Server logs – fuse,webdav, chukwa, flume, Scribe
- Hiho and sqoop for loading data into HDFS – RDBMS can join the Hadoop band wagon!
- High level interfaces required over low level map reduce programming– Pig, Hive, Jaql
- BI tools with advanced UI reporting- drilldown etc- Intellicus
- Workflow tools over Map-Reduce processes and High level languages
- Monitor and manage hadoop, run jobs/hive, view HDFS – high level view- Hue, karmasphere, eclipse plugin, cacti, ganglia
- Support frameworks- Avro (Serialization), Zookeeper (Coordination)
- More High level interfaces/uses- Mahout, Elastic map Reduce
- OLTP- also possible – Hbase
转载于:https://www.cnblogs.com/AloneSword/p/3789835.html
Hadoop ecosystem相关推荐
- Hadoop Ecosystem解决方案---数据仓库
个人总结的一套基于hadoop的海量数据挖掘的开源解决方案. BI系统: Pentaho pentaho是开源的BI系统中做得算顶尖的了. 提供的核心功能如下: 报表功能: 可视化(clien ...
- Hadoop生态圈一览
根据Hadoop官网的相关介绍和实际使用中的软件集,将Hadoop生态圈的主要软件工具简单介绍下,拓展对整个Hadoop生态圈的了解. 这是Hadoop生态从Google的三篇论文开始的发展历程,现已 ...
- 几篇关于Hadoop+Hive数据仓库的入门文章
Hadoop计算平台和Hadoop数据仓库的区别 http://datasearch.ruc.edu.cn/~boliangfeng/blog/?tag=%E6%95%B0%E6%8D%AE%E4%B ...
- Hadoop体系结构– YARN,HDFS和MapReduce
Before reading this post, please go through my previous post at "Hadoop 1.x: Architecture and H ...
- Hadoop 1.x:体系结构,主要组件以及HDFS和MapReduce的工作方式
Before reading this post, please go through my previous post at "Introduction to Hadoop" t ...
- Hadoop大数据采集
Hadoop HDFS 1.基于HDFS的云盘系统设计与实现: 1 系统基本功能模块设计 HDFS是一个高度容错性的系统, 它是运行在通用硬件上的分布式文件系统, 适合部署在廉价的机器上.HDFS能提 ...
- 大数据概况以及Hadoop生态系统
一,什么是大数据? 大数据是一个描述大量高速,复杂和可变数据的术语,需要先进的技术来实现信息的捕获,存储,分发,管理和分析.大数据包含四个特性(4v),体量(Volume).速度(Veloci ...
- hadoop的组件有哪些
Apache Hadoop是一个分布式计算系统,它主要由以下几个组件组成: Hadoop Distributed File System(HDFS):这是Hadoop的分布式文件系统,负责存储大量的数 ...
- Hadoop 生态圈 ————Hbase数据库
HBase是一个分布式的,面向列的开源数据库,该技术来源于Fay Chang所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".HBase不同于一般的关系 ...
最新文章
- c语言编程输入年月日判断是否合法,C语言程序设计:输入年月日判断这是这一年中的第几天...
- 浅析arm的异常、中断和arm工作模式的联系
- 51单片机除法c语言,求一个 89C51 简易计算器的c语言程序 只要加减乘除就行!
- Android实现系统ROOT, 并能赋予app root权限
- 文巾解题 595. 大的国家
- CodeForces - 765D Artsem and Saunders(数学化简+构造+思维)
- 【小白成长撸】--二分查找
- java 树 右键菜单_jQuery实现自定义右键菜单的树状菜单效果
- eps提取高程点在哪里_Eps总结(3)——Eps使用点云生成等高线及高程点
- PyTorch实现的ResNet50、ResNet101和ResNet152
- java运行 .class文件_运行java的class文件方法详解
- 如何编辑修改PDF文件内容?修改方法很简单
- 卡内基梅隆大学计算机科学博士,卡内基梅隆大学有哪些专业处于世界顶尖水平?...
- 《富爸爸穷爸爸》阅读笔记
- 不懂设计的产品不是好开发
- 读书节最该买的书,我都帮你们挑出来了
- Android中的AOP编程之AspectJ实战实现数据埋点
- 搞前端开发的比后端多两倍,这意味着哪一个更有前途?
- 如何构建企业数据资产运营体系
- android 服务检测,Android检测某个服务是否还活着代码
热门文章
- 字符串转换 BSTR/LPSTR/LPWSTR/Char
- ASP.NET 2.0中母版页中引用文件路径的问题(收集)
- 这可能是目前最好的图像超分辨率算法,刚刚开源了
- 次世代角色建模的学习流程,软件学习顺序
- csv文件python是怎么输入的,python怎么读取和写入csv文件
- 【OpenCV】OpenCV函数精讲之 -- 颜色空间缩减及LUT函数
- python词云有什么用_使用Python定制词云
- 复练-软考高级-论文写作专题
- 上海东海学院计算机,上海东海职业技术学院
- ionic android绝对定位,Safari中的CSS故障与Ionicons作为背景内容和绝对定位