优化整体思路

  1. 如果资源充足就加资源加内存,
  2. 调度链路优化,调整调度顺序,时效性要求高的模型先产出,
  3. 数据接入模块,调优数据接入工具sqoop,datax
  4. 模型设计质量不高,调整模型,提高质量和复用度,尽可能减少join
  5. hive参数调优
  6. sql调优,数据倾斜,join原则

模型优化

存储类型:parquet

压缩类型:Snappy

分区:PARTITIONED BY (DT String

模型设计:字段类型,字段冗余,主键等,历史表,拉链表

一、SQL执行顺序

代码写的顺序:om ( select distinct user_id

select ... from .a join b. on .. where.... group by... having... order by.. 

msyql语句执行顺序 :

from. join . on . where...group by... having.... select ... order by...

hive 语句

Hive 优化--SQL执行顺序、Hive参数、数据倾斜 、小文件优化相关推荐

  1. hive中sql执行顺序

    1.from 2.join on 或 lateral view explode(需炸裂的列)  tbl   as  炸裂后的列名 3.where 4.group by  (开始使用select中的别名 ...

  2. Hive SQL执行顺序

    1.执行顺序 在 hive 和 mysql 中都可以通过 explain+sql 语句,来查看执行顺序.对于一条标准 sql 语句,它的书写顺序是这样的: select - from - where ...

  3. 061 hive中的三种join与数据倾斜

    一:hive中的三种join 1.map join 应用场景:小表join大表 一:设置mapjoin的方式: )如果有一张表是小表,小表将自动执行map join. 默认是true. <pro ...

  4. SQL 执行顺序图解

    目录 执行顺序 数据的关联过程 执行顺序 这是一条标准的查询语句: 这是我们实际上SQL执行顺序: 我们先执行from,join来确定表之间的连接关系,得到初步的数据 where对数据进行普通的初步的 ...

  5. Spark SQL执行流程解析之 sql执行顺序

    一.Spark SQL模板解析 Spark Sql 关键字执行顺序跟Sql执行顺序类似: 1.先将from前两表做笛卡尔积加载进来形成虚拟表vt1, 2.on条件后为真的插入虚拟表形成vt2, 如果包 ...

  6. [Spark][Hive][Python][SQL]Spark 读取Hive表的小例子

    [Spark][Hive][Python][SQL]Spark 读取Hive表的小例子 $ cat customers.txt 1 Ali us 2 Bsb ca 3 Carls mx $ hive ...

  7. MySQL高级 - SQL技巧 - SQL执行顺序及正则表达式

    SQL执行顺序 编写顺序 SELECT DISTINCT<select list> FROM<left_table> <join_type> JOIN<rig ...

  8. sql笔记1:sql执行优先级和casewhen用法、sql执行顺序

    MySQL 语句中执行优先级--and比or高 例: select * from table where 条件1 AND 条件2 OR 条件3 等价于 select * from table wher ...

  9. java程序基础——SQL执行顺序

    SQL执行顺序 1.from 2.join 3.on 4.where 5. group by(开始使用select中的别名,后面的语句中都可 以使用) 6.avg,sum.... 7.having 8 ...

最新文章

  1. 智能+制造,聪明的公司都走上了智能制造的道路
  2. Android中绘制圆形和圆角图片
  3. UNITY2018 真机开启deepprofiling的操作
  4. Office Communication Server(OCS) 2007存档和CDR的部署
  5. jQuery图表插件 JS Charts
  6. Docker 验证 Centos7.2 离线安装 Docker 环境
  7. Remoting疑惑续集之再续
  8. jQuery实现tab栏转换
  9. 有效解决vue动态绑定多个class的官方实例语法无效的问题
  10. PDI(KETTLE)学习笔记
  11. vmware workstation14永久激活密钥分享
  12. 电脑怎么用计算机打开指令,命令提示符怎么用 命令提示符快捷键打开使用技巧详解...
  13. 003-信息技术学科知识与教学能力
  14. day31-20180720-流利阅读笔记
  15. 川农在线期末机考答案2020计算机,川农网院20秋《计算机网络》期末机考
  16. USB数据端子 type-A/B/C
  17. 泳道流程图:跨职能流程图
  18. 无穷无穷小的逻辑相容性小的逻辑相容性
  19. 程序员该如何养生?5个简单的日常保健养生小知识
  20. echarts 自定义平均线值

热门文章

  1. 网站统计中的数据收集原理及实现(js埋点实现)
  2. css设置按钮样式_使用CSS设置按钮样式的快速指南
  3. WMS系统解决方案,多系统无缝集成,解决信息孤岛
  4. Java单例模式(饿汉式和懒汉式)代码
  5. Ubuntu 搭建FTP文件服务器
  6. Java学习需要具备什么条件?
  7. 前端IM使用以及视频通讯记录分项
  8. 上三角矩阵、矩阵转换、矩阵交换、杨辉三角详解
  9. 用C语言输出各种三角形
  10. H5-脱机API-Application Cache-1.1