设计数仓前,粗略估计其所占空间大小是非常重要的。只有估计出空间大小,才能确定数仓将要在什么粒度级别下进行设计。下图给出基本步骤:

(1)确定数据仓库中将要创建的所有表

通常情况下,总是有一到两个非常大的表和一些小表。

(2)估计每张表中行的大小

不需要确切的大小,只需要一个上限和一个下限。

(3)估计一年内表中可能的最少行数和最多行数

(4)使用和估计一年所占空间大小同样的方法,估计未来5年的大小

(5)计算索引数据所占空间

(6)计算最终空间大小

将各表中行数可能的最大值和最小值分别乘以数据的最大长度和最小长度。另外,还要将索引项数目与关键字长度的乘积累计到总的数据量中确定出最终需要的数据总量。最后,还要考虑备份和恢复的所需空间大小。

--参考《数据仓库 第四版》

【数据仓库】数据仓库设计前如何粗估所需的存储空间大小?相关推荐

  1. 三十五、数据仓库的设计和应用

    1. 数据仓库的设计 1.1 数据仓库设计的基本内容 本节我们将研究用于信息处理.分析处理和数据挖掘的数据仓库设计,数据仓库的设计与使用包含的内容有: 数据仓库的设计的商务分析框架 数据仓库的设计过程 ...

  2. 数据仓库主题设计及元数据设计

    明确仓库的对象:主题和元数据 大多数商务数据都是多维的,所以采集和表示三维以上的数据不能完全借用业务数据库设计中的方法,必须有一种新的方法来表达多维数据.现阶段流行的有2种方 法,一是面向对象方法,即 ...

  3. 面向CRM系统的数据仓库的设计与实现

    [IT168 信息化] 0 引 言 近几年来,随着竞争的日益激烈,企业正在由以产品和利润为中心转向以客户为中心,客户关系管理(custorner relationship management,CRM ...

  4. 基于阿里云的数据仓库架构设计

    文章目录 基于阿里云的数据仓库架构设计 产品对比 离线数仓 实时数仓 数仓规范 基于阿里云的数据仓库架构设计 产品对比 阿里云产品 同类产品 简介 RDS MySQL.PostgreSQL 关系型数据 ...

  5. 数据仓库架构设计的一点概念

    1.数据仓库所处环节 在一个成体系.结构化的数据应用场景下,数据和处理有四个层次: 操作层.数据仓库层.部门/数据集市层.个体层. 操作层 操作层是指为具体业务提供实时响应的各个业务系统,比如常见的订 ...

  6. 数据仓库-数据仓库的简介(由来、与关系数据库的区别、数据仓库模型)

    数据仓库的基本概念 数据仓库泛化.合并多维空间的数据.构造数据仓库涉及数据清理.数据集成和数据变换,可以看做数据挖掘的一个重要预处理步骤.此外,数据仓库提供联机分析处理(OLAP)工具,用于各种粒度的 ...

  7. 数据仓库—数据仓库—Sybase IQ 介绍

    http://blog.itpub.net/8128313/viewspace-895289/ 软件厂商: Sybase 授权方式: 商用软件 版本号: 无 版本类型: 企业版 语言版本: 中文 软件 ...

  8. 2015湖南长沙生存费用粗估

    2015湖南长沙生存费用粗估表 目录 第一部分 估算原由3 第二部分 估算方法3 第三部分 中国长沙生存费用估算表3 第一部分 估算原由 前一段时间国家每年一度的平均工资发布了.国家统计局发布的201 ...

  9. 学习PCB设计前的知识扫盲

    参考: PCB是怎么消灭元器件之间的电线:铜迹线 走进工厂:PCB线路板是如何制造出来的 学习PCB设计前的知识扫盲,新手向,越新手越好! 下一步可继续学习简易的PCB绘制: 如何快速阅读芯片数据手册 ...

最新文章

  1. 谁的青春不迷茫,其实我们都一样
  2. 【微信公众号开发】获取并保存access_token、jsapi_ticket票据(可用于微信分享、语音识别等等)...
  3. 域控服务器发生w32time错误
  4. Redis缓存穿透 缓存击穿 缓存雪崩原因及其解决方案
  5. JavaScript实现搜索框效果
  6. Time, Clocks, and the Ordering of Events in 翻译
  7. 未来计算机论文1500,致未来的自己作文1500字
  8. coturn的负载均衡特性_高性能负载均衡
  9. APAC SharePoint Conference 2007 讲义与资源下载
  10. [JSP]自定义标签库taglib
  11. 谈谈App的混合开发
  12. redis之列表字典操作
  13. springboot 神通数据库
  14. c语言面试题-基本概念
  15. 软考网络工程师教程第五版(2018年最新版)
  16. MySQL子查询,多表查询
  17. Manjaro20KDE桌面环境安装Google输入法
  18. 如何用python批量下载数据_如何基于Python批量下载音乐
  19. swing api 文档
  20. 使用 PD Recover 恢复 PD 集群

热门文章

  1. React学习笔记一 JSX语法组件
  2. ObjC学习10-Foundation框架之内存管理
  3. 塞班、libc.lib、系统错误-1、KErrNotFound、内嵌sis、embedded sis
  4. apache http server 停止工作_Tomcat9配置HTTP/2
  5. VMware的安装与设置
  6. inner/left/right/full join on
  7. 和菜鸟一起学linux总线驱动之初识spi驱动数据传输流程【转】
  8. 通过脚本下派WsusAgent3.0.exe
  9. python2.7.12源码编译
  10. 一组数字1-n,随机取走3个,求被取走的数【腾讯前端面试题】