Hadoop的文件系统主要来自google File System :GFS

一、什么是大数据,本质?

1、数据的存储:分布式文件系统(分布式存储)----------------------->HDFS:Hadoop Distrisbuted File System

2、数据的计算:分布式计算

二、如何解决大数据的存储?-------------->分布式文件系统(HDFS,来源于CFS)

1、CFS:没有硬盘的,数据只能存在内存中

2、hadoop的安装模式:

举例子:

(*)本地模式:1台

(*)伪分布模式:1台

(*)全分布模式:3台

1、什么是RageRank(MapReduce的问题的来源)

(*)搜索排名

举例:

2、MapReduce基础编程模型

举例

BigTable------------------->大表-------------------->NoSQL数据库:HBase

1、关系型数据库(Oracle、Mysql,SQL Server)的特点

1、什么是关系型数据库?基于关系模型(基于二维模型)所提出的一种数据库

2、ER(Entity-Relationalship)模型:通过增加外键来减少数据冗余

举例:

2、什么是BigTable?把所有数据保存在一张表中,采用冗余------------------>好处:提高效率

1、因为有了bigtable的死刑:NoSQL:HBase数据库

2、HBase基于Hadoop的HDFS

3、描述HBase的表结构

举例:

Hadoop基础知识相关推荐

  1. Hadoop之Hadoop基础知识面试复习

    Hadoop之Hadoop基础知识常问面试题 列举几个hadoop生态圈的组件并做简要描述. Zookeeper:是一个开源的分布式应用程序协调服务,基于zookeeper可以实现同步服务,配置维护, ...

  2. Hadoop之Hadoop基础知识

    Hadoop之Hadoop基础知识复习 目录 Hadoop是什么 Hadoop的优势 Hadoop组成 大数据技术生态体系 1. Hadoop是什么 1)Hadoop是一个由Apache基金会所开发的 ...

  3. Hadoop权威指南 _04_第I部分Hadoop基础知识_第2章关于MapReduce

    第I部分Hadoop基础知识 第2章关于MapReduce MapReduce是一种可用于数据处理的编程模型.该模型比较简单,但要想写出有用的程序却不太容易.Hadoop 可以运行各种语言版本的Map ...

  4. Hadoop权威指南 _03_第I部分Hadoop基础知识_第1章初识Hadoop.

    第I部分Hadoop基础知识 第1章初识Hadoop. 比较喜欢这句极其形象的比喻. "在古时候,人们用牛来拉重物.当一头牛拉不动根圆木时,人们从来没有考虑过要想方设法培育出一种更强壮的牛. ...

  5. 大数据入门第一课 Hadoop基础知识与电商网站日志数据分析

    大数据入门第一课 Hadoop基础知识与电商网站日志数据分析 本课程从Hadoop核心技术入手,以电商项目为依托,带领你从0基础开始上手,逐步掌握大数据核心技术(如:HDFS.YARN.MapRedu ...

  6. #CSDN软件工程师能力认证学习精选# Hadoop基础知识学习

    CSDN软件工程师能力认证是由CSDN制定并推出的一个能力认证标准,宗旨是让一流的技术人才凭真才实学进大厂拿高薪,同时为企业节约大量招聘与培养成本,使命是提升高校大学生的技术能力,为行业提供人才储备, ...

  7. Hadoop学习笔记—15.HBase框架学习(基础知识篇)

    Hadoop学习笔记-15.HBase框架学习(基础知识篇) HBase是Apache Hadoop的数据库,能够对大型数据提供随机.实时的读写访问.HBase的目标是存储并处理大型的数据.HBase ...

  8. 学习hadoop需要具备基础知识

    学习hadoop需要具备基础知识 首先整体上了解Hadoop,包括hadoop是什么,能够做什么,使用场景等,不需要考虑细节问题.在有了整体上的了解后,就开始准备系统地学习hadoop.建议:勿一味学 ...

  9. 基于Hadoop的数据仓库Hive 基础知识

    转载自:namelessml 原文链接:[完]基于Hadoop的数据仓库Hive 基础知识 Hive是基于Hadoop的数据仓库工具,可对存储在HDFS上的文件中的数据集进行数据整理.特殊查询和分析处 ...

最新文章

  1. 【java】Maven工程引入各种jar包的功能
  2. gpupdate /force 遇报错解决过程
  3. 前端性能优化:使用媒体查询加载指定大小的背景图片
  4. MEF 导入(Import)和导出(Export)
  5. CSS 文本转换 text-transform属性
  6. Eclipse清除SVN的账号信息
  7. Android系统是目前最为流行的手机系统之一
  8. 语音识别/合成开源项目
  9. Python数据分析基础: 数据缺失值处理
  10. 华易记账宝 v6.5
  11. 第五章运算符表达式和语句
  12. 程序员面试 算法研究 编程艺术 红黑树 机器学习5大系列集锦
  13. android之WebView应用
  14. matlab第六章课后答案,MATLAB教程2012a第6章习题解答-张志涌
  15. 男孩,请用几分钟看这篇文章(女孩别看,会哭 )
  16. IT系统管理员的节日
  17. 虚拟机增加磁盘空间后lv扩容详细流程,linux扩容根目录详细流程【openstack和VMware虚拟机方法同理】,centos重装系统lvm后不可用处理流程,2021尾声祝福送上。
  18. Aqua Data Studio连接Hive
  19. 一文尽览 | 基于点云、多模态的3D目标检测算法综述!(Point/Voxel/Point-Voxel)
  20. Android局域网实现FTP文件上传下载客户端与服务端

热门文章

  1. 机器学习面试问题大概梳理(转)
  2. PHP实现QQ达人信息抓取
  3. 何修改基于ArcGIS Server .NET ADF确良9.3的WEB SERVER端口使ArcGIS Server Manager来创建WEB应用的注意事项...
  4. vue改变标签属性_Vue用v-for给循环标签自身属性添加属性值的方法
  5. fastica和pca区别_PCA与ICA
  6. django orm关联查询_Django ORM 聚合查询和分组查询实现详解
  7. c语言十几行编译出上百k,二级C语言上机编程题技巧总结选读.doc
  8. h5封装去底部_Appium—Native+H5混合APP的自动化
  9. 秋季唯美海报,打造的一系列秋季主题视觉
  10. 设计素材 | 来一份秋高气爽——秋季促销海报