第一章 概述
1.当今是数据大爆炸的时代,数据的存储与分析成为问题
2.hadoop hdfs解决存储问题 mapreduce解决批量分析问题。
3.大量数据由于好的算法。推荐算法依赖大量用户数据。
4.hadoop名字的由来 doug cutting 孩子的毛绒玩具。
5. 2006年 hadoop诞生 2008成为apache 顶级项目
6. 与传统关系数据库对比: 数据量大 非实时 批量处理 数据可以是半结构化
第二章 mapreduce
1.用于数据处理的编程模型 特点:并行执行
2.map 函数负责 数据预处理 (key,[value1,value2,value3])
3.reduce函数负责 得到处理结果 遍历map阶段 value数组。
第三章 hdsf分布式文件系统
1.分布式文件系统:管理网络中多台计算机存储的文件系统。架构于网络之上,引入了网络编程的复杂性
2.分布式文件系统的容错 不丢失数据
3.hdsf存储超大文件 流式数据访问 商业硬件

hadoop权威指南 读书笔记相关推荐

  1. MapReduce总结 + 相关Hadoop权威指南读书笔记(未完......欢迎补充,互相学习)

    文章目录 MapReduce概述 MapReduce优缺点 MapReduce核心思想 MapReduce进程 MapReduce编程规范 WordCount 案例实操 本地测试 集群测试 Hadoo ...

  2. mysql数据库权威指南_MySQL_MySQL权威指南读书笔记(三),第二章:MYSQL数据库里面的数 - phpStudy...

    MySQL权威指南读书笔记(三) 第二章:MYSQL数据库里面的数据 用想用好MYSQL,就必须透彻理解MYSQL是如何看待和处理数据的.本章主要讨论了两个问题:一是SQL所能处理的数据值的类型:二是 ...

  3. MongoDB权威指南读书笔记——CRUD

    插入并保存文档 插入是向MongoDB中添加数据的基本方法.可以使用Insert方法向目标集合插入一个文档:db.foo.insert({"bar" : "baz&quo ...

  4. HTTP权威指南读书笔记

    <<HTTP权威指南>>读书笔记 第一部分:Web的基础 第1章:HTTP概述 主要内容 1.什么是HTTP 2.HTTP的基本组件 HTTP HTTP:HTTP(Hypert ...

  5. HTML5权威指南----读书笔记

    <!DOCTYPE html> <html> <head><meta name = 'keywords' content="HTML5权威指南--- ...

  6. Hadoop权威指南学习笔记三

    HDFS简单介绍 声明:本文是本人基于Hadoop权威指南学习的一些个人理解和笔记,仅供学习參考.有什么不到之处还望指出,一起学习一起进步. 转载请注明:http://blog.csdn.net/my ...

  7. Hadoop权威指南学习笔记一

    Hadoop简单介绍 声明:本文是本人基于Hadoop权威指南学习的一些个人理解和笔记,仅供学习參考,有什么不到之处还望指出.一起学习一起进步. 转载请注明:http://blog.csdn.net/ ...

  8. 计算机网络和http权威指南 读书笔记

    计算机网络笔记 网络层 网络层向上提供无连接的,尽最大努力交付的数据报服务 网络层不提供数据质量承诺 物理层使用的中间设备叫转发器repeater 数据链路层叫网桥bridge 网络层叫路由器rout ...

  9. Hadoop权威指南阅读笔记

    2019独角兽企业重金招聘Python工程师标准>>> 1.MR和关系型数据 MR和传统的关系型数据库处理的数据是不同,传统关系型数据库处理的是较结构化数据,对于半结构化和非机构话数 ...

  10. Hadoop权威指南 - 学习笔记

    初识Hadoop.关于MapReduce Hadoop宏观介绍 相对于其他系统的优势 关系型数据库管理系统 为什么不能用配有大量硬盘的数据库进行大规模分析?为什么需要Hadoop? 因为计算机硬盘的发 ...

最新文章

  1. Java如何拆分字符串
  2. 【已解决】Linux远程桌面连接-VNC
  3. SAP Spartacus的自定义路由
  4. backtrader2
  5. 2020年2月数据库流行度排行:冬日虽然寒冷,春光必定灿烂
  6. 我对python的理解_python之我对装饰器的理解
  7. Java中ThreadLocal的深入理解
  8. python 相对导入_Python相对导入机制详解
  9. linux 磁盘管理三部曲——(1)磁盘结构,认识分区
  10. 申屠青春对“链”和“币”的再思考
  11. uniapp php接口如何写,uni-app入门教程之接口的基本使用
  12. 智慧物流园区供应链管理系统解决方案:数智化供应链赋能物流运输行业供应链新模式
  13. keil5兼容keil4操作
  14. 西门子主程序调用子程序_子程序编程举例说明-广数m98调用子程序实例-西门子子程序调用实例...
  15. Python实战:利用Uplift模型识别营销敏感用户提升市场策略(二)
  16. etc 文件夹下放什么内容
  17. 笔记13-1(C语言 三子棋)
  18. WORD排版技巧(一)
  19. 对于line-height的一些理解
  20. 环状二肽,82863-65-8,cyclo(Leu-Tyr)

热门文章

  1. 阿里云播放器Aliplayer-WEB走坑中
  2. javamail 收件人/发件人 乱码解析
  3. 关于android studio报错Attempt to invoke virtual method 'void android.widget.ListView.setAdapter(android.
  4. Python黑帽子--黑客与渗透测试编程之道
  5. 用什么录屏软件能录制高清视频
  6. java实现文件移动_java实现文件的复制,移动
  7. 【Latex】Latex小论文模板
  8. SVN教程代码比较(图文教程)
  9. 解决Could not find artifact com.oracle:ojdbc7:pom:12.1.0.2 的方案
  10. CCS 5.5的安装教程