Hive优化---or
优化前
select count(b.user_initial_ccid)
from dwd.dwd_ccid_register_a a
left join audience_data_service.sys_user_all b
on ((b.user_id=a.union_id_md5 and b.user_type_id=15)
or (b.user_id=a.mobile_md5 and b.user_type_id=16)
or (b.user_id=a.email_md5 and b.user_type_id=11)
or (b.user_id=a.open_id_md5 and b.user_type_id=14)
or (b.user_id=a.alipay_id_md5 and b.user_type_id=18)
or (b.user_id=a.wechat_id_md5 and b.user_type_id=13)
or (b.user_id=a.ip_md5 and b.user_type_id=12)) and b.dt='current';
优化后
drop table if exists tmp.tmp_count1;create table tmp.tmp_count1 as
select b.ccid,a.*
from dwd.dwd_ccid_register_a a
left join audience_data_service.sys_user_ccid_all b
on case when a.mobile_md5 is not null then a.mobile_md5
when a.union_id_md5 is not null then a.union_id_md5
when a.open_id_md5 is not null then a.open_id_md5
when a.email_md5 is not null then a.email_md5
when a.alipay_id_md5 is not null then a.alipay_id_md5 end = b.user_id
and case when a.mobile_md5 is not null then 16
when a.union_id_md5 is not null then 15
when a.open_id_md5 is not null then 14
when a.email_md5 is not null then 11
when a.alipay_id_md5 is not null then 18 end = b.user_type_id;
Hive优化---or相关推荐
- hive 行转列和列转行的方法_读离线和实时大数据开发实战,为你揭开 Hive 优化实践的神秘面纱...
前言 「1024,1GB,一级棒!程序仔们节日快乐!」 ❝ 指尖流动的 1024 行代码,到底是什么? ❞ ❝ 是10行的迷茫?是101行的叛逆?是202行的理性思考?是307行对渴望的冲动?还是40 ...
- 深入浅出学Hive:Hive优化
目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...
- Hive优化(再一遍系统复习)
Hive优化(或者面试问你工作中遇到的问题就可以答hive优化) select * 是不走MR程序的 可以开启本地模式local(当文件小于默认128M且文件数少于4个,不走MR) 表的优化 (1) ...
- 窗口函数和hive优化简记
窗口函数: (1) OVER():指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变而变化.常用partition by 分区order by排序. (2)CURRENT ROW:当前行 ...
- hive 优化(二)
在讨论hive优化之前,我们需要知道的是HQL它的执行过程. 简单的说,HQL会最终转化为job,然后通过MR来执行job 问题一 既然HQL会转化为JOB,那么如果job数量太多,会不会对hive执 ...
- HIVE优化系列(1)-- 自动合并输出的小文件
小文件的缺陷我们就不说了,直接进入到正题. HIVE自动合并输出的小文件的主要优化手段为: set hive.merge.mapfiles = true:在只有map的作业结束时合并小文件, set ...
- Hive 优化(通用版)
hive优化 Hive 优化核心思想:把Hive SQL 当做Mapreduce程序去优化 以下SQL不会转为Mapreduce来执行: select仅查询本表字段 where仅对本表字段做条件过滤 ...
- CC00027.hadoop——|HadoopHive.V27|——|Hive.v27|Hive优化策略|实战.v03|
一.SQL优化 ### --- SQL优化~~~ 列裁剪和分区裁剪 ~~~ 列裁剪是在查询时只读取需要的列:分区裁剪就是只读取需要的分区. ~~~ 简单的说:select 中不要有多余的列,坚决避免 ...
- 大数据笔记30—Hadoop基础篇13(Hive优化及数据倾斜)
Hive优化及数据倾斜 知识点01:回顾 知识点02:目标 知识点03:Hive函数:多行转多列 知识点04:Hive函数:多行转单列 知识点05:Hive函数:多列转多行 知识点06:Hive函数: ...
- 一篇文章让你通透Hive优化
Hive优化 一.hive参数优化 1.map数优化 2.reduce数优化 3.Fetch抓取(Hive可以避免进行MapReduce) 4 .模式选择 1)本地模式 2)并行模式 3)严格模 ...
最新文章
- Scrum敏捷开发看板工具分享
- 机会!搞科研的同伴注意了,再忙也要看一下!
- 称不上算法的算法-1.简单的高精度计算
- 用python画玫瑰花简单-利用python的turtle库画一朵简单的玫瑰花,并添加文字
- 定点量化误差python仿真.零极点(1)
- 7个IntelliJ IDEA必备插件,提高编码效率
- 人工智能常用 API
- android applybatch,android – 使用applyBatch插入成千上万的联系人条目很慢
- layui轮播图切换会有跳动_Layui中轮播图切换函数说明
- stretchblt 模糊_拼多多直播不显示画面?直播画面模糊怎么调整
- shell备份mysql思路_写一个shell脚本备份mysql数据库的步骤
- JavaScript闭包理解【关键字:普通函数、变量访问作用域、闭包、解决获取元素标签索引】...
- casefold()方法
- Python中使用Unicode对中文进行编码和解码
- gpio stm8 管脚 配置工具_STM8S 外设模块的GPIO引脚应该如何配置
- Salt: 2015.8.8.2 L@匹配BUG
- hdu 6184 Counting Stars(三元环计数)
- freeradius在AP控制器设备中test-aaa 显示timeout的解决方案
- c语言中 输出操作是由库函数,【判断题】在 C语言中,输入操作是由库函数scanf完成,输出操作是由库函数printf完成 。...
- Python调用腾讯API发送短信验证码
热门文章
- java spring-boot-starter-mail邮件和阿里云华为云短信发送全套
- 动态规划入门——多重背包与单调优化
- 14.逻辑漏洞(行话---------裹羊毛)
- webpack使用方法(一):安装webpack
- 我有10个职场经验,价值100万,但今天免费|咪蒙
- (UE4 4.21 ) UE4给编辑器添加菜单栏(Menu),工具栏(TooBar),Tab窗口
- ucosii入门验证
- Wolfram Mathematica 12教材
- 疫情防控|Springboot+小程序+校园疫情防控系统设计与实现
- [Unity小项目]俄罗斯方块