遇到个hive 语句 用unoin all暴增的情况,

特征:

1. 两条语句查询的数据实际都是0

2. unoin all 上下 有同样的表

查看打印信息做了mapjoin ,估计是mapjoin的一个bug, 尝试加上条件

set hive.auto.convert.join.noconditionaltask = false;

set hive.optimize.mapjoin.mapreduce=false; --这条貌似可以不加

恢复正常。

转载于:https://blog.51cto.com/yjplxq/1358934

【拾贝】hive unoin all map数爆增相关推荐

  1. hive优化之------控制hive任务中的map数和reduce数

    一.    控制hive任务中的map数: 1.    通常情况下,作业会通过input的目录产生一个或者多个map任务. 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的 ...

  2. hive优化--增加减少map数

    如何合并小文件,减少map数? 假设一个SQL任务: Select count(1) from popt_tbaccountcopy_mes where pt = '2012-07-04'; 该任务的 ...

  3. 减少HQL 的MAP数

    说下遇到的另外一个CASE:在排查一个线上问题的过程中发现callqueue这几天出现了spike: 继续查看发现最近的waiting_maps数和spike非常match 进而通过grace定位到了 ...

  4. hive如何确定map数量和reduce数量?

    因为Hive底层就是MR,所以问题实际是MR如何确定map数量和reduce数量. map数量 map数量 逻辑如下 map数量=split数量 split数量=文件大小/split size spl ...

  5. Flink 1.11 与 Hive 批流一体数仓实践

    导读:Flink 从 1.9.0 开始提供与 Hive 集成的功能,随着几个版本的迭代,在最新的 Flink 1.11 中,与 Hive 集成的功能进一步深化,并且开始尝试将流计算场景与Hive 进行 ...

  6. hive表ddl导出_Flink 1.11 与 Hive 批流一体数仓实践

    简介:Flink 从 1.9.0 开始提供与 Hive 集成的功能,随着几个版本的迭代,在最新的 Flink 1.11 中,与 Hive 集成的功能进一步深化,并且开始尝试将流计算场景与Hive 进行 ...

  7. hive 复杂数据类型 在数仓中应用(array、map、struct、和其组合应用)

    环境:一般宽表建表可能考虑存储更多信息选择复杂模型建设 复杂数据类型:array.map.struct 1.数组array,里边不能装不同类型的数据 more hive_array.txt zhang ...

  8. hive 修改分桶数 分桶表_Hive中的分桶

    对于每一个表(table)或者分区, Hive可以进一步组织成桶,也就是说桶是更为细粒度的数据范围划分.Hive也是针对某一列进行桶的组织.Hive采用对列值哈希,然后除以桶的个数求余的方式决定该条记 ...

  9. MapReduce Map数 reduce数设置

    JobConf.setNumMapTasks(n)是有意义的,结合block size会具体影响到map任务的个数,详见FileInputFormat.getSplits源码.假设没有设置mapred ...

最新文章

  1. 计算机组装安装与维护作业,计算机组装与维护的作业.pdf
  2. python动态时钟代码_Python基础 用Python实现时钟
  3. XenApp 6 license导入报错的终极解决方案
  4. 园区交换网络和路由网络综合设计,测试完工啦
  5. URAL - 1732 Ministry of Truth--kmp算法的应用(kmp模板)
  6. 回首阿里10年产品经理路,1点忠告希望在2021帮到你
  7. [Swift]LeetCode17. 电话号码的字母组合 | Letter Combinations of a Phone Number
  8. 曾遭闪电贷攻击的Origin将重新推出稳定币OUSD
  9. AppServ 介绍
  10. 软件类配置(一)【Windows下使用conda在虚拟环境中安装CUDA、CUDNN及Tensorflow】
  11. [leetcode] Excel Sheet Column Title
  12. 计算机组成原理----Cache主存地址映射(计算题)
  13. python制作录屏软件_自制录屏软件,不到30行代码(仅供学习研究)
  14. 毛咕咕 百度有啊现在每天的成交量:
  15. 如何挑选童书《神奇的校车》
  16. 《动手学深度学习》(PyTorch版)代码注释 - 32 【RNN_with_zero】
  17. ROS(RouterOS)实现一线多拨+负载均衡(多图)
  18. 锋利的jQuery读书笔记(一)
  19. ti-sdk-evm-am335x-05.07 uboot分析(MLO跳转到u-boot之前)
  20. mysql 等待函数,mysql 函数

热门文章

  1. VC++多线程工作笔记0002---线程的运行状态
  2. Linux学习笔记016---CentOS7虚拟机设置使用静态IP上网_配置集群的时候可以用
  3. resnet 25 训练人脸识别
  4. bzoj 1008: [HNOI2008]越狱
  5. hibernate基本类型映射
  6. postgres 禁止远程登录_解决postgresql无法远程访问的情况
  7. 提高代码的运行效率(1)
  8. android 仿小米秒表,android实现秒表功能
  9. android居中不父布局,在父级中,TextView不会垂直居中_android_开发99编程知识库
  10. java前台计算date差_js前台计算两个日期的间隔时间