1、简述数据仓库的设计步骤。

数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。

2、简述星型模式和雪花模式的区别。

一个事实、一组维表

一个事实、维表接维表

3、数据仓库三种模式之间的关系。

星型、雪花、星座

4、在设计数据仓库时,为什么确定事实表的粒度非常重要?

事实与粒度相匹配。

5、以下关于数据粒度的叙述中哪些是错误。

(1)粒度是指数据仓库小数据单元的详细程度和级别。

(2)数据越详细,粒度就越小,抽象级别也就越高。

(3)数据综合度越高,粒度就越大,抽象级别也就越高。

(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。

6、以下关于数据仓库开发特点的叙述中哪些是错误的。

(1)数据仓库开发要从数据出发。

业务需求

(2)数据仓库使用的需求在开发出来后才会明确。

先明确,再开发。设计时要能够应对未来的变化。

(3)数据仓库开发一个不断循环的过程。

(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。

7、以下关于数据仓库设计的说法中哪些是正确的。

(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。

(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。

(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。

(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。

8、维表中维有哪些类型?

结构维、信息维、分区维、分类维、退化维、一致维、父子维

9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?

多级汇总、深入洞察、不同用户不同维、灵活

10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?

节省I/O开销

思考:

1、源变化。

急:先处理、再分责

2、bottom-up/top-down

top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。

周期长、见效慢;风险高。

bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。

数据逐步清洗提炼。

转载于:https://www.cnblogs.com/moqingtong/p/8284293.html

数据仓库与数据挖掘(二)相关推荐

  1. 计算机三级数据库数据仓库与数据挖掘(二)、数据仓库、面向主题、不可直接修改、批量访问、数据的粒度级设计、决策支持、元数据、封锁粒度、维护策略、实时维护、延时维护、快照维护、

    14.在具有数据仓库的企业数据环境中,数据仓库数据一般都具有许多特点,下列都属于其特点的是 A.面向主题.不可直接修改.批量访问 B.面向主题.可直接修改.性能要求较为宽松 C.集成的.可直接修改.批 ...

  2. 【数据库系统工程师】6.4数据仓库和数据挖掘基础知识

    目录 一.思维导图 二.知识点 1.数据仓库 (1)数据仓库与数据库比较 (2)数据仓库的基本特性 (3)数据仓库的数据模式 (4)数据仓库体系结构 2.数据挖掘 (1)数据挖掘分类 (2)数据挖掘常 ...

  3. 数据仓库与数据挖掘(全英文)期末复习

    MOOC地址数据仓库与数据挖掘_北京理工大学_中国大学MOOC(慕课) (icourse163.org)https://www.icourse163.org/course/BIT-1464031178 ...

  4. 《数据仓库与数据挖掘》期末复习总结

    <数据仓库与数据挖掘>期末复习总结 适用教材:<数据挖掘概念与技术(第3版)>,Jiawei Han,Mieheline Kamber,Jian Pei著,机械工业出版社 提示 ...

  5. 数据仓库与数据挖掘的一些基本概念

    下面内容摘自互联网并作了整理. 名词: BI(Business Intelligence):商业智能, DW(Data Warehouse):数据仓库,详见正文Q1部分. OLTP(On-Line T ...

  6. 数据仓库ETL(二)基本概念

    数据治理领域有一些基本名词,数据仓库,数据挖掘,商业智能,数据同步,联机计算等等,下面一起看一下专有的名词. DB(DataBase) 数据库,一般指支撑应用的数据库,包括MySQL,Oracle,P ...

  7. 《数据仓库与数据挖掘教程》ch01绪论 章节整理

    数据仓库概述 从传统数据库到数据仓库 计算机数据处理有两种主要方式 事务型处理 分析型处理 传统数据库与事务处理 传统数据库是长期存储在计算机内的.有组织的.可共享的数据集合 有严格的数学理论支持,并 ...

  8. 计算机三级数据库数据仓库与数据挖掘(一)、快照方式、元数据、数据仓库中数据特征、机器学习、聚类方法、分类算法、决策支持系统、表数据的粒度级、分布式数据库、

    1.在建立数据仓库的数据集成工作中,需要采用适当的策略从数据源获取变化数据.下列数据表中,一般情况下不适宜采用快照方式从业务系统获取数据的是 A.门店表.销售人员表 B.商品清单.商品类别表 C.顾客 ...

  9. 数据仓库与数据挖掘教程 || 警务数据仓库“犯罪_ETL”,“地址_ETL”和“派出所_ETL”数据流任务配置说明

    本文主要是关于清华大学出版社,黄德才老师<数据仓库与数据挖掘教程>第四章中关于警务数据仓库"犯罪_ETL","地址_ETL"和"派出所_E ...

  10. 《数据仓库与数据挖掘》期末复习总结(1)

    <数据仓库与数据挖掘>期末复习总结(1)-(第一章 引论) 第一章 引论 1.OLAP 2.大数据的5V特征 3.数据挖掘 4.数据挖掘实验基本步骤 5.数据挖掘过程 6.数据的基本形式 ...

最新文章

  1. 关于ref 和 out 关键字【整理】
  2. hoj 1072 活动安排问题
  3. 全字段排序 VS rowid 排序
  4. AUTOSAR从入门到精通100讲(二十七)-AutoSar模式管理总揽
  5. 关于手机端CSS Sprite图标定位的一些领悟
  6. 关于angularjs input上传图片前获取图片的Size 浅析
  7. 通过SectionIndexer实现微信通讯录
  8. 安裝MAVEN插件(轉)
  9. 用VS2015编译pjsip的工程pjproject-vs14
  10. pandas cut qcut 分箱算法详解
  11. 【Gym-101889 D】Daunting device【分块】
  12. mysqldump 快还是navicat快_剪辑软件评测:选喵影工厂、爱剪辑还是快剪辑?
  13. 大型公司网路架构浅谈
  14. python treeview控件使用详解_winform Treeview控件使用
  15. Vue入门项目:学生管理系统之班级管理 【含源码】
  16. imx6 linux 开发环境,从0搭建imx6ul开发环境
  17. 如今传统行业应该进行数字化转型?
  18. MSF之ms17-010永恒之蓝漏洞利用
  19. 使用物价水平修正票房数据,长津湖还是票房冠军吗?
  20. arduino自制cnc绘图仪_教程 - Arduino + 光驱改造数控绘图机 - MAKE 趣无尽

热门文章

  1. tcp连接python_python网络编程--TCP连接的三次握手(三报文握手)与四次挥手
  2. java(jdk) 8u45 正式版_缺氧正式版,草图分享(克莱)
  3. Redis进阶不得不了解的内存优化细节
  4. Eclipse-cdt 配合 gdbserver 进行 arm 程序远程调试 上
  5. Compile opencv 2.4.9/2.4.10.1 as static library
  6. 淘宝双十一火爆下的暗礁?
  7. 在Amazon S3 上架设静态网站
  8. perl删除Windows下的图片缓存缩略图(Thumbs.db)
  9. Windows之远程访问×××的简单部署
  10. Ubuntu 18.04修改默认源为国内源