hadpood的java编写的

nameNode和dataNode的关系和新华字典中 索引和数据的关系一样

将数据切分成很多个块(dataNode),并以HA机制进行存储;

shell

sort:排序(默认整行排);

uniq:去重;

-c:count,计算数量

mapRedcuce

map:对数据进行处理;(和stream中的用法一致)

shuffle:将重复的key的数据进行集合处理;

reduce:根据自己想要的值进行输出;

由map->shuffle->reduce的多个过程中,数据都需要压缩和解压,不然会对网络资源造成压力;(可以降低网络消耗,但要增加处理时间)

yarn管理的是cpu、内存(、硬盘)

1.0中的jobTracker只能单点,不能HA,如果宕机后很麻烦;

2.0中的ResourceManager是管理资源用的(cpu、内存);nodeManager是管理任务的;

非重点内容===============↓↓↓↓↓=================

HDFS中的小文件多时,nodeName内存是会不断扩大的直到被填满,而且多了会很慢;

注:

大数据系统和业务应用系统的交互:

FTP:跨网的时候,不同业务主线

直接落库

kafka直接同步落库或直接业务支持

hadoop学习-1相关推荐

  1. Hadoop学习笔记一 简要介绍

    Hadoop学习笔记一 简要介绍 这里先大致介绍一下Hadoop.     本文大部分内容都是从官网Hadoop上来的.其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了.我的这一 ...

  2. 我的hadoop学习之路

    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上. Ha ...

  3. Hadoop学习笔记(1) ——菜鸟入门

     Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分布式系统基础架构,由Apache基金会所开发.用户能够在不了解分布式底层细节的情况下.开发分布式 ...

  4. Hadoop学习笔记(1)

    原文:http://www.cnblogs.com/zjfstudio/p/3859704.html Hadoop学习笔记(1) --菜鸟入门 Hadoop是什么?先问一下百度吧: [百度百科]一个分 ...

  5. Hadoop学习笔记—18.Sqoop框架学习

    Hadoop学习笔记-18.Sqoop框架学习 一.Sqoop基础:连接关系型数据库与Hadoop的桥梁 1.1 Sqoop的基本概念 Hadoop正成为企业用于大数据分析的最热门选择,但想将你的数据 ...

  6. [Hadoop] Hadoop学习历程 [持续更新中…]

    1. Hadoop FS Shell Hadoop之所以可以实现分布式计算,主要的原因之一是因为其背后的分布式文件系统(HDFS).所以,对于Hadoop的文件操作需要有一套全新的shell指令来完成 ...

  7. Hadoop学习全程记录——在Eclipse中运行第一个MapReduce程序

    网友分享,拿来共享一下 这是Hadoop学习全程记录第2篇,在这篇里我将介绍一下如何在Eclipse下写第一个MapReduce程序. 新说明一下我的开发环境: 操作系统:在windows下使用wub ...

  8. Hadoop学习笔记—20.网站日志分析项目案例(一)项目介绍

    Hadoop学习笔记-20.网站日志分析项目案例(一)项目介绍 网站日志分析项目案例(一)项目介绍:当前页面 网站日志分析项目案例(二)数据清洗:http://www.cnblogs.com/edis ...

  9. Hadoop学习笔记(8) ——实战 做个倒排索引

    Hadoop学习笔记(8) --实战 做个倒排索引 倒排索引是文档检索系统中最常用数据结构.根据单词反过来查在文档中出现的频率,而不是根据文档来,所以称倒排索引(Inverted Index).结构如 ...

  10. Hadoop学习笔记—4.初识MapReduce

    一.神马是高大上的MapReduce MapReduce是Google的一项重要技术,它首先是一个 编程模型 ,用以进行大数据量的计算.对于大 数据量的计算,通常采用的处理手法就是并行计算.但对许多开 ...

最新文章

  1. 深入理解 Embedding层的本质
  2. python要学多久才可以去找工作-Python学到什么程度才可以去找工作?掌握这4点足够了!...
  3. WindowsPhone8游戏开发字体国际化化
  4. php数据访问(查询)
  5. QHBoxLayout
  6. java网络编程阻塞_Java网络编程由浅入深三 一文了解非阻塞通信的图文代码示例详解...
  7. [Leetcode][第336题][JAVA][回文对][暴力][HashSet][字典树]
  8. Max retries exceeded with url
  9. 测试面试题集-MySQL数据库灵魂拷问加强版
  10. ssms 连接 ssis_在SSMS中手动设置SSIS包加密
  11. 线程1-线程常用方法
  12. 油猴脚本的安装、配置及使用方法
  13. 拉普拉斯平滑Laplace Smoothing
  14. 计算机如何使用键盘复制粘贴,电脑复制粘贴快捷键,小编教你电脑怎么用键盘复制粘贴...
  15. 避免选中页面文字或者内容时出现蓝色背景
  16. 深入了解示波器(三):示波器的带宽
  17. Super Socks5cap使用教程
  18. lol无限乱斗服务器,LOL无限火力升级无限乱斗 LOL无限乱斗玩法攻略
  19. 电脑按键坏掉之后的解决办法
  20. 基于pgrouting求任意两点的最短路径的函数pgr_fromAtoB

热门文章

  1. java ldap 父_Java LDAP操作
  2. MCNP 学习笔记之空气比释动能(F4 F5 计数卡)
  3. fiddler设置字体
  4. android 存储盘 dcim,DCIM是个啥?安卓图片存储位置指南
  5. 了不起的女性开发者:90后误选专业入对行,酷女孩霸榜开源NO.1
  6. 项目经验之:针对昨日FDO连接SDF文件报错,国外GIS论坛给出了一个思路.帮助我过关.
  7. Window-10 Hyper-V 安装 Windows 10
  8. 超详细markdown语法和typora教程
  9. 麒麟子Cocos Creator 3D研究笔记五:模型骨骼动画查看器
  10. 直播弹幕系统(五)- 整合Stomp替换原生WebSocket方案探究