然后我们再来看一下hive的架构

可以看到hive,左边有个元数据存储,就是存了一些元数据,通过这些元数据我们可以,找到具体我们存的实际的数据.

然后右边hive提供了cli命令行的方式操作hive以及jdbc的方式处理数据.

然后通过cli或者jdbc,连接hive以后,然后把写好的sql,经过sql parser解析器,解析sql以后,然后再编译sql,然后再优化sql,然后再去执行

sql,然后这个sql解析器,实际上做的就是把我们写的sql,转换成了mapper 和reducer,然后最终交给

mapreduce去执行,执行以后,把结果放到hdfs中去.

还要注意hive默认把元数据存到derby中去了,这个小数据库,不好用,用它还会有问题,所以后边我们会

配置这个元数据数据库,设置为mysql来用.

可以看到这里当需要jdbc连接hive的时候中间会用到这个hive的驱动.

Hive大数据-Hive的架构---大数据之Hive工作笔记0003相关推荐

  1. Thinking in BigData(八)大数据Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解

          纯干货:Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解. 通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS.MapReduce.Hbase.H ...

  2. 数据中心网络架构 — 云数据中心网络 — 大二层网络技术

    目录 文章目录 目录 大二层网络诞生的背景 数据中心的东西流量成为了主流 服务器虚拟化带来的虚拟机迁移问题 大二层网络 大二层网络的问题 大二层网络诞生的背景 数据中心的东西流量成为了主流 早期数据中 ...

  3. 数据中心网络架构 — 传统数据中心网络 — 传统树型三层网络架构

    目录 文章目录 目录 数据中心组网架构 传统三层网络架构 核心层(Core Layer) 汇聚层(Aggregation Layer) 接入层(Access Layer) 三层网络架构的设计原则 三层 ...

  4. 数据中心网络架构 — 传统数据中心网络 — 胖树型三层网络架构

    目录 文章目录 目录 胖树型(Fat-Tree)网络架构 Fat-Tree 是一种无带宽收敛的网络架构 Fat-Tree 的网络拓扑 Fat-Tree 的缺点 胖树型(Fat-Tree)网络架构 为了 ...

  5. 大数据_Flink_数据处理_运行时架构5_slot和任务调度---Flink工作笔记0020

    1.并行计算不同的任务,分配到不同的线程上就可以并行计算了 2.然后并行任务,现在我们知道,如果我们设置的并行度是3,那么这里需要的slot就是3个对吧 这个跟任务的最大并行度有关 3.然后就是我们写 ...

  6. 大数据_Spark_核心模块介绍---Spark工作笔记0003

    注意可以看到,spark sql,以及spark streaming,spark mlib,spark graphx 其中这个spark sql,是可以允许写sql来查询数据, spark strea ...

  7. 大数据_Flink_流式处理_简介_流数据处理的应用行业---Flink工作笔记0003

    技术交流QQ群[JAVA,C++,Python,.NET,BigData,AI]:170933152 流处理和批处理想必,就是低延时和吞吐量高,用就用的他这个特点. 如果,数据量特别大,可能一个批处理 ...

  8. 大数据之-Nifi-了解Nifi处理器_和Nifi的其他组件---大数据之Nifi工作笔记0003

    然后我们来看nifi的处理器,可以看到左上角是用来添加处理器的, 拖过来就能添加 拖过来以后,会显示一个弹框,里面会显示各种处理器,有293个..常用的都够了 可以在右边搜索以后添加 看一下常用的处理 ...

  9. 大数据之-入门_大数据特点(4V)---大数据之hadoop工作笔记0003

    1PB =1024 T BAT+头条+美团的数据,基本就是EB规模的. 1ZB=1024EB ,海量数据

最新文章

  1. LINQ 学习路程 -- 查询操作 GroupBy ToLookUp
  2. python实现K-means算法
  3. 大话设计模式读书笔记--4.代理模式
  4. 大数据笔记2019.5.6
  5. 设计模式 — 创建型模式 — 建造者模式
  6. JS级别联动下拉列表
  7. java api接口报500_应用程序编程接口API,我们来聊一聊这个熟悉的名词
  8. 【CF - 699C】 Vacations (日程安排 dp)
  9. LeetCode 83. Remove Duplicates from Sorted List
  10. 汽车短视频大行其道,新能源汽车平台杉车网如何“领风骚”?
  11. plsql developer13的下载、instantclient的下载
  12. 正确使用SqlConnection对象,兼谈数据库连接池
  13. css特效之水滴效果
  14. [英文话剧][搞笑话剧短剧][中英文对照]7人话剧 新三顾茅庐
  15. 【后端架构完善与接口开发】003-新增ebook表,生成持久层代码
  16. 用计算机打根号怎么打,根号在电脑上怎么打出来啊?
  17. 前端如何判断用户是否打开了控制台
  18. SpringCloud之GateWay的基础使用
  19. AI系统识别早期败血症,减少患者死亡率
  20. (三)linux文件与目录管理

热门文章

  1. window两个窗口上下摆放_window对象方法(open和close)
  2. python创建虚拟环境失败_virtualenv 创建虚拟环境不成功
  3. 2017年3月计算机二级c语言真题,2017年3月计算机二级C语言习题及答案
  4. Extjs中的组件含有ID,会导致界面混乱。(textfield,comboBox等)
  5. 一行代码就能解决微服务分布式事务问题,你知道GTS怎么做到的吗?
  6. Spark学习之路 (六)Spark Transformation和Action
  7. ES6、TYPESCRIPT、ATSCRIPT和BABEL是什么玩意儿
  8. KETTLE6.0版本体验小结
  9. Java CyclicBarrier介绍
  10. 免费网页模板提供站推荐