今天我们来讲一下如何看懂Hive的查询计划。
hive的执行计划包括三部分:
– Abstract syntax tree – 可以直接忽略  
– Stage dependencies – 依赖 
– Stage plans – hive如何执行任务的信息。
下面还是以一个案例作为说明
设置自动连接为false的话,要走5步。
4 Map Reduces tells you something is not right.  
Stage:    Stage-1    
Map    Reduce    
Stage:    Stage-2    
Map    Reduce    
Stage:    Stage-3    
Map    Reduce    
Stage:    Stage-4    
Map    Reduce   
设置自动连接为true就只有4步
Only 2 Map Reduces  
Stage:    Stage-8    
Map    Reduce    
Stage:    Stage-4    
Map    Reduce
hive直接就加载了要做连接的表,client和path表,其中client表做了过滤,剩下的map/reduce是用来连接和排序的。

Hive Tuning(三) 从查询计划看hive.auto.convert.join的好处相关推荐

  1. sql 循环处理数据_图文介绍 SQL 的三种查询计划处理模型,Spark 用了其中两个

    我已经在之前的 <一条 SQL 在 Apache Spark 之旅(上)>.<一条 SQL 在 Apache Spark 之旅(中)> 以及 <一条 SQL 在 Apac ...

  2. hive遍历_从Hive中的stored as file_foramt看hive调优

    一.行式数据库和列式数据库的对比 1.存储比较 行式数据库存储在hdfs上式按行进行存储的,一个block存储一或多行数据.而列式数据库在hdfs上则是按照列进行存储,一个block可能有一列或多列数 ...

  3. Hive学习(三)操作Hive的方式及优化

    Hive 一.操作Hive的两种方式 1.通过Beenline 2.通过JDBC 二.Hive的优化 1.Hive优化的思想: 2.优化的方式 (1)开启本地模式 (2)开启并行计算 (3)严格模式 ...

  4. Hive 大小表关联查询异常

    异常原因:mr将数据量小的表识别成了大表,数据量大的识别成小表,导致将数据量大的表加入到内存,导致程序异常 处理方法: set hive.execution.engine=mr; set hive.m ...

  5. hive相对于oracle的优点,【Hive】Hive面试题

    1.hive的join有几种方式,怎么实现join的? left join --以左表为基准,不符合的值以null值显示 --工作中以left join 居多,大表加载小表的形式 select emp ...

  6. hive实战读书笔记(第9章)Hive性能优化

    hive用户面临的一个比较大的问题是,用户需要等待较长的响应时间,与传统关系数据库查询的性能相比,hive响应速度慢的令人发指 本章介绍一套诊断改进hive查询性能的系统方法,通过这个过程,将单个hi ...

  7. hive报错(1)MoveTask/HIVE return code 1、2、3

    今天在CDH上执行hive sql的时候报了一个错 错误内容为: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive. ...

  8. hive快还是mysql快_HBase相对Hive查询速度快的对比

    原标题:HBase相对Hive查询速度快的对比 首先Hive的底层首先是MR,是属于批处理处理时间相对较长,不属于实时读写.在其架构上HBase和Hive有很大的区别. 架构介绍: Hive架构 –( ...

  9. hadoop离线阶段(第十三节)数据仓库、hive简介、hive安装和hive的三种交互模式

    目录 数据仓库 数据仓库的基本概念 数据仓库的主要特征 数据仓库与数据库区别 数据仓库分层架构 数据仓库元数据管理 Hive简介 什么是Hive Hive的特点 Hive架构 Hive与Hadoop的 ...

  10. Hive第三天——Hive使用(二)(join语句)

    文章部分参考自:https://blog.csdn.net/qq_23897391/article/details/92636509 Hive第三天--Hive使用 自己的话:黑发不知勤学早,白首方悔 ...

最新文章

  1. Seagull License Server 9.4 SR3 2781 完美激活(解决不能打印问题)
  2. matlab从入门到精通-常用的几种缺失值处理方法
  3. ElementUI中el-table在表格最下方添加一列汇总小计行
  4. unity, eulerAngle
  5. android mdpi对应哪一个屏幕,android 常见分辨率(mdpi、hdpi 、xhdpi、xxhdpi )及屏幕适配...
  6. MOSS服务器场迁移1-有关切换登录用户时需要刷新一次才能成功的问题
  7. python assert_python assert使用说明
  8. PLC与常用设备的连接
  9. docker监听通信
  10. Oracle 常用函数/语法总结
  11. 汽车EE架构:5大域介绍
  12. excel学习-添加控件
  13. 在计算机系统中对文件执行彻底删除,Windows系统中,教你彻底删除C盘的顽固文件,瞬间多出10个G!...
  14. TMS570-3-RTI中断
  15. 人物-胡玮炜:胡玮炜
  16. 比较好的PHP开源项目
  17. Oracle系列:start with connect by prior 使用方法
  18. 华为IT总监离职时给大家写了一封告别信
  19. 父类指针可以指向子类对象
  20. html随机出现一张图片,图片随机飘动用html怎么做

热门文章

  1. jmp怎么做合并的箱线图_Python数据可视化:箱线图多种库画法
  2. java七武器系列_Java七武器系列多情环 --多功能Profiling工具 JVisual VM
  3. java常量表达式区别_java编译器对string常量表达式的处理和优化
  4. python常用网站信息收集:持续更新版本--
  5. linux环境下,Tomcat详细部署步骤
  6. 正则表达式在NLP的基本应用
  7. MyBatis Generator.xml详解
  8. (转)iOS-蓝牙学习资源博文收集
  9. Spring的Bean有哪些作用域?
  10. MySQL数据库导入错误:ERROR 1064 (42000) 和 ERROR at line xx: Unknown command '\Z'.