hadoop学习-1
hadpood的java编写的
nameNode和dataNode的关系和新华字典中 索引和数据的关系一样
将数据切分成很多个块(dataNode),并以HA机制进行存储;
shell
sort:排序(默认整行排);
uniq:去重;
-c:count,计算数量
mapRedcuce
map:对数据进行处理;(和stream中的用法一致)
shuffle:将重复的key的数据进行集合处理;
reduce:根据自己想要的值进行输出;
由map->shuffle->reduce的多个过程中,数据都需要压缩和解压,不然会对网络资源造成压力;(可以降低网络消耗,但要增加处理时间)
yarn管理的是cpu、内存(、硬盘)
1.0中的jobTracker只能单点,不能HA,如果宕机后很麻烦;
2.0中的ResourceManager是管理资源用的(cpu、内存);nodeManager是管理任务的;
非重点内容===============↓↓↓↓↓=================
HDFS中的小文件多时,nodeName内存是会不断扩大的直到被填满,而且多了会很慢;
注:
大数据系统和业务应用系统的交互:
FTP:跨网的时候,不同业务主线
直接落库
kafka直接同步落库或直接业务支持
hadoop学习-1相关推荐
- Hadoop学习笔记一 简要介绍
Hadoop学习笔记一 简要介绍 这里先大致介绍一下Hadoop. 本文大部分内容都是从官网Hadoop上来的.其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了.我的这一 ...
- 我的hadoop学习之路
Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上. Ha ...
- Hadoop学习笔记(1) ——菜鸟入门
Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户能够在不了解分布式底层细节的情况下.开发分布式 ...
- Hadoop学习笔记(1)
原文:http://www.cnblogs.com/zjfstudio/p/3859704.html Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分 ...
- Hadoop学习笔记—18.Sqoop框架学习
Hadoop学习笔记-18.Sqoop框架学习 一.Sqoop基础:连接关系型数据库与Hadoop的桥梁 1.1 Sqoop的基本概念 Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据 ...
- [Hadoop] Hadoop学习历程 [持续更新中…]
1. Hadoop FS Shell Hadoop之所以可以实现分布式计算,主要的原因之一是因为其背后的分布式文件系统(HDFS).所以,对于Hadoop的文件操作需要有一套全新的shell指令来完成 ...
- Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序
网友分享,拿来共享一下 这是Hadoop学习全程记录第2篇,在这篇里我将介绍一下如何在Eclipse下写第一个MapReduce程序. 新说明一下我的开发环境: 操作系统:在windows下使用wub ...
- Hadoop学习笔记—20.网站日志分析项目案例(一)项目介绍
Hadoop学习笔记-20.网站日志分析项目案例(一)项目介绍 网站日志分析项目案例(一)项目介绍:当前页面 网站日志分析项目案例(二)数据清洗:http://www.cnblogs.com/edis ...
- Hadoop学习笔记(8) ——实战 做个倒排索引
Hadoop学习笔记(8) --实战 做个倒排索引 倒排索引是文档检索系统中最常用数据结构.根据单词反过来查在文档中出现的频率,而不是根据文档来,所以称倒排索引(Inverted Index).结构如 ...
- Hadoop学习笔记—4.初识MapReduce
一.神马是高大上的MapReduce MapReduce是Google的一项重要技术,它首先是一个 编程模型 ,用以进行大数据量的计算.对于大 数据量的计算,通常采用的处理手法就是并行计算.但对许多开 ...
最新文章
- 深入理解 Embedding层的本质
- python要学多久才可以去找工作-Python学到什么程度才可以去找工作?掌握这4点足够了!...
- WindowsPhone8游戏开发字体国际化化
- php数据访问(查询)
- QHBoxLayout
- java网络编程阻塞_Java网络编程由浅入深三 一文了解非阻塞通信的图文代码示例详解...
- [Leetcode][第336题][JAVA][回文对][暴力][HashSet][字典树]
- Max retries exceeded with url
- 测试面试题集-MySQL数据库灵魂拷问加强版
- ssms 连接 ssis_在SSMS中手动设置SSIS包加密
- 线程1-线程常用方法
- 油猴脚本的安装、配置及使用方法
- 拉普拉斯平滑Laplace Smoothing
- 计算机如何使用键盘复制粘贴,电脑复制粘贴快捷键,小编教你电脑怎么用键盘复制粘贴...
- 避免选中页面文字或者内容时出现蓝色背景
- 深入了解示波器(三):示波器的带宽
- Super Socks5cap使用教程
- lol无限乱斗服务器,LOL无限火力升级无限乱斗 LOL无限乱斗玩法攻略
- 电脑按键坏掉之后的解决办法
- 基于pgrouting求任意两点的最短路径的函数pgr_fromAtoB
热门文章
- java ldap 父_Java LDAP操作
- MCNP 学习笔记之空气比释动能(F4 F5 计数卡)
- fiddler设置字体
- android 存储盘 dcim,DCIM是个啥?安卓图片存储位置指南
- 了不起的女性开发者:90后误选专业入对行,酷女孩霸榜开源NO.1
- 项目经验之:针对昨日FDO连接SDF文件报错,国外GIS论坛给出了一个思路.帮助我过关.
- Window-10 Hyper-V 安装 Windows 10
- 超详细markdown语法和typora教程
- 麒麟子Cocos Creator 3D研究笔记五:模型骨骼动画查看器
- 直播弹幕系统(五)- 整合Stomp替换原生WebSocket方案探究