优化前

select count(b.user_initial_ccid)
from dwd.dwd_ccid_register_a  a
left join audience_data_service.sys_user_all b
on ((b.user_id=a.union_id_md5 and b.user_type_id=15)
or (b.user_id=a.mobile_md5 and b.user_type_id=16)
or (b.user_id=a.email_md5 and b.user_type_id=11)
or (b.user_id=a.open_id_md5 and b.user_type_id=14)
or (b.user_id=a.alipay_id_md5 and b.user_type_id=18)
or (b.user_id=a.wechat_id_md5 and b.user_type_id=13)
or (b.user_id=a.ip_md5 and b.user_type_id=12)) and b.dt='current';

优化后

drop table if exists tmp.tmp_count1;create table tmp.tmp_count1 as
select b.ccid,a.*
from dwd.dwd_ccid_register_a a
left join audience_data_service.sys_user_ccid_all b
on case when a.mobile_md5 is not null then a.mobile_md5
when a.union_id_md5 is not null then a.union_id_md5
when a.open_id_md5 is not null then a.open_id_md5
when a.email_md5 is not null then a.email_md5
when a.alipay_id_md5 is not null then a.alipay_id_md5 end = b.user_id
and case when a.mobile_md5 is not null then 16
when a.union_id_md5 is not null then 15
when a.open_id_md5 is not null then 14
when a.email_md5 is not null then 11
when a.alipay_id_md5 is not null then 18 end = b.user_type_id;

Hive优化---or相关推荐

  1. hive 行转列和列转行的方法_读离线和实时大数据开发实战,为你揭开 Hive 优化实践的神秘面纱...

    前言 「1024,1GB,一级棒!程序仔们节日快乐!」 ❝ 指尖流动的 1024 行代码,到底是什么? ❞ ❝ 是10行的迷茫?是101行的叛逆?是202行的理性思考?是307行对渴望的冲动?还是40 ...

  2. 深入浅出学Hive:Hive优化

    目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...

  3. Hive优化(再一遍系统复习)

    Hive优化(或者面试问你工作中遇到的问题就可以答hive优化) select * 是不走MR程序的 可以开启本地模式local(当文件小于默认128M且文件数少于4个,不走MR) 表的优化 (1) ...

  4. 窗口函数和hive优化简记

    窗口函数: (1) OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化.常用partition by 分区order by排序. (2)CURRENT ROW:当前行 ...

  5. hive 优化(二)

    在讨论hive优化之前,我们需要知道的是HQL它的执行过程. 简单的说,HQL会最终转化为job,然后通过MR来执行job 问题一 既然HQL会转化为JOB,那么如果job数量太多,会不会对hive执 ...

  6. HIVE优化系列(1)-- 自动合并输出的小文件

    小文件的缺陷我们就不说了,直接进入到正题. HIVE自动合并输出的小文件的主要优化手段为: set hive.merge.mapfiles = true:在只有map的作业结束时合并小文件, set ...

  7. Hive 优化(通用版)

    hive优化 Hive 优化核心思想:把Hive SQL 当做Mapreduce程序去优化 以下SQL不会转为Mapreduce来执行: select仅查询本表字段 where仅对本表字段做条件过滤 ...

  8. CC00027.hadoop——|HadoopHive.V27|——|Hive.v27|Hive优化策略|实战.v03|

    一.SQL优化 ### --- SQL优化~~~ 列裁剪和分区裁剪 ~~~ 列裁剪是在查询时只读取需要的列:分区裁剪就是只读取需要的分区. ~~~ 简单的说:select 中不要有多余的列,坚决避免 ...

  9. 大数据笔记30—Hadoop基础篇13(Hive优化及数据倾斜)

    Hive优化及数据倾斜 知识点01:回顾 知识点02:目标 知识点03:Hive函数:多行转多列 知识点04:Hive函数:多行转单列 知识点05:Hive函数:多列转多行 知识点06:Hive函数: ...

  10. 一篇文章让你通透Hive优化

    Hive优化 一.hive参数优化 1.map数优化 2.reduce数优化 3.Fetch抓取(Hive可以避免进行MapReduce) 4 .模式选择  1)本地模式  2)并行模式  3)严格模 ...

最新文章

  1. Scrum敏捷开发看板工具分享
  2. 机会!搞科研的同伴注意了,再忙也要看一下!
  3. 称不上算法的算法-1.简单的高精度计算
  4. 用python画玫瑰花简单-利用python的turtle库画一朵简单的玫瑰花,并添加文字
  5. 定点量化误差python仿真.零极点(1)
  6. 7个IntelliJ IDEA必备插件,提高编码效率
  7. 人工智能常用 API
  8. android applybatch,android – 使用applyBatch插入成千上万的联系人条目很慢
  9. layui轮播图切换会有跳动_Layui中轮播图切换函数说明
  10. stretchblt 模糊_拼多多直播不显示画面?直播画面模糊怎么调整
  11. shell备份mysql思路_写一个shell脚本备份mysql数据库的步骤
  12. JavaScript闭包理解【关键字:普通函数、变量访问作用域、闭包、解决获取元素标签索引】...
  13. casefold()方法
  14. Python中使用Unicode对中文进行编码和解码
  15. gpio stm8 管脚 配置工具_STM8S 外设模块的GPIO引脚应该如何配置
  16. Salt: 2015.8.8.2 L@匹配BUG
  17. hdu 6184 Counting Stars(三元环计数)
  18. freeradius在AP控制器设备中test-aaa 显示timeout的解决方案
  19. c语言中 输出操作是由库函数,【判断题】在 C语言中,输入操作是由库函数scanf完成,输出操作是由库函数printf完成 。...
  20. Python调用腾讯API发送短信验证码

热门文章

  1. java spring-boot-starter-mail邮件和阿里云华为云短信发送全套
  2. 动态规划入门——多重背包与单调优化
  3. 14.逻辑漏洞(行话---------裹羊毛)
  4. webpack使用方法(一):安装webpack
  5. 我有10个职场经验,价值100万,但今天免费|咪蒙
  6. (UE4 4.21 ) UE4给编辑器添加菜单栏(Menu),工具栏(TooBar),Tab窗口
  7. ucosii入门验证
  8. Wolfram Mathematica 12教材
  9. 疫情防控|Springboot+小程序+校园疫情防控系统设计与实现
  10. [Unity小项目]俄罗斯方块