hadoop是一个分布式存储系统,他可以将我们的日志、数据等存储到不同的节点上(当数据十分大的时候),有时候一份数据会被存储到不同机器的不同磁盘上面。

那么问题来了:
我们想取出这么一整份数据并做对应计算怎么办呢?
这个时候,mapreduce就应运而生。它是一个依托于hadoop上的计算引擎,主要就是对数据进行合并汇总等操作,本身并不存储数据。
那hive是什么呢?
hive是基于hadoop的一个数据仓库工具。由于mapreduce程序比较复杂,故而hive对他做了一层封装。它可以将我们写的hql翻译成mapreduce去计算数据。说白了,它就是一个搞翻译的

但是由于mapreduce每次都是对磁盘进行操作,每次中间job操作的输出结果,都是先存到磁盘里面的,这样再去读取中间job的数据再进行操作的时候,速度就很慢。
这个时候 spark计算引擎就可以解决这个问题,spark每次中间job的操作结果,都是存入内存,之后的读取也是直接从内存读出,大大的提高了数据计算的速度,也因为如此 spark的计算成本要比mapreduce贵(一个用内存过渡,一个用磁盘过渡)。当然spark并不止依托于分布式存储系统上面。

mapreduce和spark的共同点之一:他们均不存储数据,只对数据进行操作(计算)
浅显理解,本文完毕。

hive和hadoop的浅显理解相关推荐

  1. hadoop生态圈的理解

    hadoop部分:hadoop生态圈的理解(HDFS,MapReduce,HBASE,zookeeper,hive,sqoop,flume,kafka,yarn,spark) 一.简介         ...

  2. Hive和Hadoop及RDBMS关系

    Hive 与 Hadoop 的关系 Hive利用HDFS存储数据,利用MapReduce查询分析数据 Hive与传统数据库对比 hive用于海量数据的离线数据分析 总结:hive具有sql数据库的外表 ...

  3. MVC简单学习以及浅显理解

    以下仅为个人简单浅显理解: MVC来处理Web问题: 路由定位:(如何快速精确地定位请求,分层管理请求?) 此处使用视图Controller的思想来达到分离不同层下的请求,对于同一层下的请求放入一个控 ...

  4. 对@RequestMapping的简单理解(浅显理解)

    在SSM整合使用中对@RequestMapping的浅显理解 ================================================== 了解什么是@RequestMappi ...

  5. 深度学习:模型的泛化能力浅显理解

    深度学习:模型的泛化能力浅显理解 通俗易懂的浅显理解 通俗易懂的浅显理解 模型的泛化能力通俗易懂的说就是模型在测试集(其中的数据模型以前没有见过)中的表现,也就是模型举一反三的能力,但是这些数据必须满 ...

  6. 指针、引用、const、类的浅显理解

    指针.引用.const.类的浅显理解 一.引用 1.1 理解与实验 和const 1.1.1 实验一 1.1.1 实验二 二.指针 三.指针和引用的区别 四.const(const和pointer) ...

  7. 读书笔记:为啥要有Hive?Hadoop上查询性能问题

    因为提数需要用到Hive,于是阅读<Hive实战>,并整理成笔记, 下面是来自我:一个数据开发路人甲的理解,如何不当欢迎留言或私信. 1. 再认识Hadoop 粗略地说,Hadoop是针对 ...

  8. hadoop学习--基于Hive的Hadoop日志分析

    本文将本地的hadoop日志,加载到Hive数据仓库中,再过滤日志中有用的日志信息转存到Mysql数据库里. 环境:hive-0.12.0 + Hadoop1.2.1 1.日志格式 2014-04-1 ...

  9. 对凸优化(Convex Optimization)的一些浅显理解

    ©作者 | 李航前 单位 | EPFL 研究方向 | 计算机图形学与三维视觉 最近学习了一些凸优化课程,整理笔记的同时写下一些自己的理解,向着头秃的道路上越走越远. 凸优化是应用数学的一个基本分支,几 ...

最新文章

  1. img should be PIL Image. Got <class ‘numpy.ndarray‘>
  2. mysql - 要问 varchar 能存几个汉字? 能存几个 字母? 能存几个数字?请看下文讲解 (Java)
  3. 机器学习(machine learning)之AdaBoost算法
  4. 硒等待:内隐,外显,流利和睡眠
  5. 服务器返回它们的和_无服务器有其陷阱。 这是避免它们的方法。
  6. 如何在labview中用c语言编程,编程语言之争:LabVIEW还是C语言?-测试测量-与非网...
  7. 学习笔记 - Nginx在多层代理下获取真实客户端IP地址
  8. 火柴排队(codevs 3286)题解
  9. 数组指针 vs 指针数组
  10. KL散度 JS散度 熵
  11. Pr视频剪辑软件使用小结
  12. 小白刷LeeCode(算法篇)3
  13. 将网站放到桌面快捷方式
  14. 平均年薪60.8万,Linux开发拿下这个证书有多吃香?
  15. 命令行生成、运行及调用jar包
  16. 使用FakeAPP进行AI换脸必看!!
  17. 常用的遥感植被指数介绍
  18. java开源工作流引擎优势是什么?
  19. Java通用C# SM2加密解密
  20. 香港科大詹华强发明头发检测吸毒新技术

热门文章

  1. Matlab中Robotics toolbox的安装及使用
  2. 聊聊gorm的OnConflict
  3. 2.4.1 HMC连接状态
  4. 双非渣本,5年从三流外包到阿里P6,面筋分享,给2021的移动开发一些建议
  5. Bagging (bootstrap aggregating) - 集成方法之一
  6. 图像沿列方向降维的AVX2实现讨论
  7. win7系统修复工具_联想出品30多款系统快速修复工具,为你的电脑保驾护航!
  8. 性能分析到底是不是性能测试工程师的能力?
  9. css预处理全部知识点一文讲清楚
  10. 一位中科院自动化研究所博士的毕业论文致谢:求学22载,计算机终成一生的事业与希望...