数据仓库与数据挖掘(二)
1、简述数据仓库的设计步骤。
数据仓库规划(用户业务目标、仓库目标)和需求分析、建模、物理模型设计、部署、维护。
2、简述星型模式和雪花模式的区别。
一个事实、一组维表
一个事实、维表接维表
3、数据仓库三种模式之间的关系。
星型、雪花、星座
4、在设计数据仓库时,为什么确定事实表的粒度非常重要?
事实与粒度相匹配。
5、以下关于数据粒度的叙述中哪些是错误。
(1)粒度是指数据仓库小数据单元的详细程度和级别。
(2)数据越详细,粒度就越小,抽象级别也就越高。
(3)数据综合度越高,粒度就越大,抽象级别也就越高。
(4)粒度的具体划分将直接影响数据仓库中的数据量以及查询质量。
6、以下关于数据仓库开发特点的叙述中哪些是错误的。
(1)数据仓库开发要从数据出发。
业务需求
(2)数据仓库使用的需求在开发出来后才会明确。
先明确,再开发。设计时要能够应对未来的变化。
(3)数据仓库开发一个不断循环的过程。
(4)数据仓库中数据的分析和处理十分灵活,没有固定的开发模式。
7、以下关于数据仓库设计的说法中哪些是正确的。
(1)数据仓库项目的需求很难把握,所以不可能从用户的需求出发来进行数据仓库的设计,只能从数据出发进行设计。
(2)在进行数据仓库主题数据模型设计时,应该按部门业务应用的方式来设计数据模型。
(3)在进行数据仓库主题数据模型设计时要强调数据的集成性。
(4)在进行数据仓库概念模型设计时,需要设计实体关系图,给出数据表的划分,并给出每个属性的定义域。
8、维表中维有哪些类型?
结构维、信息维、分区维、分类维、退化维、一致维、父子维
9、在数据仓库的物理模型设计中,为什么要考虑维的概念分层?
多级汇总、深入洞察、不同用户不同维、灵活
10、在数据仓库的物理模型设计中,合并表组织策略有哪些好处?
节省I/O开销
思考:
1、源变化。
急:先处理、再分责
2、bottom-up/top-down
top-down:技术成熟、业务过程理解透彻。规范化程度高,最小化数据冗余与不一致性。便于全局。
周期长、见效慢;风险高。
bottom-up:见效快,投资少,灵活;由于部门需求简单,容易实现。
数据逐步清洗提炼。
转载于:https://www.cnblogs.com/moqingtong/p/8284293.html
数据仓库与数据挖掘(二)相关推荐
- 计算机三级数据库数据仓库与数据挖掘(二)、数据仓库、面向主题、不可直接修改、批量访问、数据的粒度级设计、决策支持、元数据、封锁粒度、维护策略、实时维护、延时维护、快照维护、
14.在具有数据仓库的企业数据环境中,数据仓库数据一般都具有许多特点,下列都属于其特点的是 A.面向主题.不可直接修改.批量访问 B.面向主题.可直接修改.性能要求较为宽松 C.集成的.可直接修改.批 ...
- 【数据库系统工程师】6.4数据仓库和数据挖掘基础知识
目录 一.思维导图 二.知识点 1.数据仓库 (1)数据仓库与数据库比较 (2)数据仓库的基本特性 (3)数据仓库的数据模式 (4)数据仓库体系结构 2.数据挖掘 (1)数据挖掘分类 (2)数据挖掘常 ...
- 数据仓库与数据挖掘(全英文)期末复习
MOOC地址数据仓库与数据挖掘_北京理工大学_中国大学MOOC(慕课) (icourse163.org)https://www.icourse163.org/course/BIT-1464031178 ...
- 《数据仓库与数据挖掘》期末复习总结
<数据仓库与数据挖掘>期末复习总结 适用教材:<数据挖掘概念与技术(第3版)>,Jiawei Han,Mieheline Kamber,Jian Pei著,机械工业出版社 提示 ...
- 数据仓库与数据挖掘的一些基本概念
下面内容摘自互联网并作了整理. 名词: BI(Business Intelligence):商业智能, DW(Data Warehouse):数据仓库,详见正文Q1部分. OLTP(On-Line T ...
- 数据仓库ETL(二)基本概念
数据治理领域有一些基本名词,数据仓库,数据挖掘,商业智能,数据同步,联机计算等等,下面一起看一下专有的名词. DB(DataBase) 数据库,一般指支撑应用的数据库,包括MySQL,Oracle,P ...
- 《数据仓库与数据挖掘教程》ch01绪论 章节整理
数据仓库概述 从传统数据库到数据仓库 计算机数据处理有两种主要方式 事务型处理 分析型处理 传统数据库与事务处理 传统数据库是长期存储在计算机内的.有组织的.可共享的数据集合 有严格的数学理论支持,并 ...
- 计算机三级数据库数据仓库与数据挖掘(一)、快照方式、元数据、数据仓库中数据特征、机器学习、聚类方法、分类算法、决策支持系统、表数据的粒度级、分布式数据库、
1.在建立数据仓库的数据集成工作中,需要采用适当的策略从数据源获取变化数据.下列数据表中,一般情况下不适宜采用快照方式从业务系统获取数据的是 A.门店表.销售人员表 B.商品清单.商品类别表 C.顾客 ...
- 数据仓库与数据挖掘教程 || 警务数据仓库“犯罪_ETL”,“地址_ETL”和“派出所_ETL”数据流任务配置说明
本文主要是关于清华大学出版社,黄德才老师<数据仓库与数据挖掘教程>第四章中关于警务数据仓库"犯罪_ETL","地址_ETL"和"派出所_E ...
- 《数据仓库与数据挖掘》期末复习总结(1)
<数据仓库与数据挖掘>期末复习总结(1)-(第一章 引论) 第一章 引论 1.OLAP 2.大数据的5V特征 3.数据挖掘 4.数据挖掘实验基本步骤 5.数据挖掘过程 6.数据的基本形式 ...
最新文章
- 关于ref 和 out 关键字【整理】
- hoj 1072 活动安排问题
- 全字段排序 VS rowid 排序
- AUTOSAR从入门到精通100讲(二十七)-AutoSar模式管理总揽
- 关于手机端CSS Sprite图标定位的一些领悟
- 关于angularjs input上传图片前获取图片的Size 浅析
- 通过SectionIndexer实现微信通讯录
- 安裝MAVEN插件(轉)
- 用VS2015编译pjsip的工程pjproject-vs14
- pandas cut qcut 分箱算法详解
- 【Gym-101889 D】Daunting device【分块】
- mysqldump 快还是navicat快_剪辑软件评测:选喵影工厂、爱剪辑还是快剪辑?
- 大型公司网路架构浅谈
- python treeview控件使用详解_winform Treeview控件使用
- Vue入门项目:学生管理系统之班级管理 【含源码】
- imx6 linux 开发环境,从0搭建imx6ul开发环境
- 如今传统行业应该进行数字化转型?
- MSF之ms17-010永恒之蓝漏洞利用
- 使用物价水平修正票房数据,长津湖还是票房冠军吗?
- arduino自制cnc绘图仪_教程 - Arduino + 光驱改造数控绘图机 - MAKE 趣无尽
热门文章
- tcp连接python_python网络编程--TCP连接的三次握手(三报文握手)与四次挥手
- java(jdk) 8u45 正式版_缺氧正式版,草图分享(克莱)
- Redis进阶不得不了解的内存优化细节
- Eclipse-cdt 配合 gdbserver 进行 arm 程序远程调试 上
- Compile opencv 2.4.9/2.4.10.1 as static library
- 淘宝双十一火爆下的暗礁?
- 在Amazon S3 上架设静态网站
- perl删除Windows下的图片缓存缩略图(Thumbs.db)
- Windows之远程访问×××的简单部署
- Ubuntu 18.04修改默认源为国内源