最近才开始接触数仓性能优化,好像走进迷宫,头上永远顶着两句话:
这个是啥,那个是啥
因为数仓好像没啥性能优化的,可能这是小白的一种自我良好认知
根据我们的业务,优化工具经常用到的有以下两个
1、和mysql 类似。用 explain 工具
用这个工具,主要是用来查 资源内存和执行语句的时间问题
这也是关乎性能的基本指标
2、用命令 或者工具 dbeaver,查看输出, profile
这个没怎么看过,不做解释了,欢迎有用过的,来探讨

3、最近学到的优化方法,好像也不是什么高深的东西

1、 对于复杂的子查询语句,超过三个,四个的模型关联,就创建临时结果表,分步进行,曲线救国
2、最好不要用 merge 和 update ,多用 使用 Delete+Insert 。用了之后,大家都说好
3、尽量清空表,最好不要删除表,虽然delete 比较干脆利落的,但是数据量大,删除也是一项巨大工作量,,尝试分区删除,或者 truncate
4、 最原始的一个计划,应该是第一步就是构建模型时的分区 partition by 时,涉及分区字段要注意,避免数据倾斜
5、 涉及 很大的数据量,脚本开发多使用 /*+ DIRECT */
来代替 insert 或者 update ,
最近用这个比较多

Vertica系列:数仓优化相关推荐

  1. 数仓维度建模系列-数仓规范篇

    本系列将持续更新数仓建模相关知识,将学习到的理论知识和工作实践结合起来,总结沉淀下来,积跬步成千里. 上一篇介绍了维度建模体系的搭建,这次来分享下搭建数据仓库涉及的各种规范. 分享我工作中遇到的一个小 ...

  2. 系列 | 数仓实践第三篇NO.3『拉链表』

    点击上方蓝色字体,置顶/星标哦 目前10000+人已关注加入我们 拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的:顾名思义,所谓拉链表,就是记录历史,记录一个事务从开始一直到当 ...

  3. 数据仓库系列:初识数仓

    数据仓库系列:初识数仓 前言: 本节是数据仓库系列文章的第一篇,本系列的目的在于快速的构建一套最小化可运行的基础数据体系,过程中也会涉及一些数仓的理论知识,但更偏重的是数仓的实现和背后的思考逻辑.所以 ...

  4. 新数仓系列:开源组件运营(3)

    大数据前几年各种概念争论很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,现在这股热潮被AI接过去了.大数据真正落地到车联网,分控,各种数据分析等等具体场景. 概念很高大上,搞得久了就会发 ...

  5. hive当前日期超前_微博数仓数据延时优化方案

    前言 本文以离线数据仓库为背景,重点介绍因传输链路数据延时的不确定性,可能导致部分延迟文件无法参与正常的调度计算或同步,导致数据缺失的问题成因.业务影响及相应的解决方案.关于这类问题的处理,有这么一种 ...

  6. 数据仓库系列(四)数仓架构以及多维数据模型的设计

    文章目录 一.前言 二.数据仓库的定义 三.数据仓库的特点 四.数据仓库的作用 五.数据仓库的架构 六.数据仓库的要求 七 .数据仓库分层 八.数据仓库四个层次的划分 8.1 ODS层 8.2 PDW ...

  7. 数据仓库系列文章一:浅谈数仓设计

    数仓设计指对数据仓库的各项组成进行规划,在正式建设数仓之前形成指导性建设方案. 数仓设计主要分为两部分:数据仓库同操作型业务系统的数据接口设计和数仓自身建设设计. 本文从多个方面探讨数仓的设计要点,给 ...

  8. 系列 | 漫谈数仓第四篇NO.4 『数据应用』(BIOLAP)

    点击上方蓝色字体,置顶/星标哦 目前10000+人已关注加入我们 本文目录CONTENTS ☞ 01.可视化BI工具 [ 开源BI,商业BI,传统BI ] ☞ 02.OLAP科普 [ ROLAP  M ...

  9. 系列 | 漫谈数仓第二篇NO.2 『数据模型』(维度建模建模工具)

    点击上方"数据仓库与Python大数据",选择"置顶/星标" 本文导航 前言: model对于数仓是最核心的东西,数据模型是数据组织和存储方法,模型的好坏,决定 ...

最新文章

  1. Sharepoint 2010 页面设计确实方便
  2. wxWidgets:wxMouseEvent类用法
  3. java怎么安装_Java桌面应用程序篇:发展历史以及程序的应用
  4. 飞利浦 TASY 电子病历系统中存在严重漏洞,可暴露患者记录
  5. html组合标题,如何组合标题关键词(影响标题的5个因素)
  6. MATLAB Simmechanics/Simscape四旋翼无人机控制仿真(1) SolidWorks模型的导入
  7. 使用Draw免费在线作图
  8. 编译SAM BA报错
  9. 从零开始搭建自己的个人博客网站
  10. 最完美的“婚”鞋? NMD_R2“囍”(台灣愛迪達)
  11. CyanogenMod12编译教程
  12. 达芬奇密码 第三十章
  13. 16组Sony索尼系列相机Slog2和Slog3常用Vlog电影LTUS调色预设 Slog2 Slog3视频灰片调色预设
  14. 基于HTML5 Canvas实现黑白滤镜
  15. 天正坐标标注显示不全_CAD命令栏坐标显示不全
  16. Vuex状态刷新状态丢失的处理方法
  17. NLP【05】pytorch实现glove词向量(附代码详解)
  18. win10关闭(更新并关机)与(恢复更新)
  19. 简单总结Unity使用AssetDatabase编辑器资源管理
  20. jdk安装遇到cab文件损坏问题

热门文章

  1. vue 地图使用navigator_初识ABP vNext(6):vue+ABP实现国际化
  2. python 读取csv_Python实现CSV数据的读取--两种方法实现
  3. 庖丁解牛!深入剖析React Native下一代架构重构
  4. JavaScript-callapply方法
  5. 微信小程序 自定义组件(stepper)
  6. 从DB-Engines看传统数据库生存状况
  7. 2021-03-14Java大数据Week2
  8. eclipse代码编辑区字符串自动转义设置
  9. 常用设计模式——创建型
  10. 【汇编语言与计算机系统结构笔记17】MIPS 汇编初步