数据仓库(ETL)、数据仓库工具Informatica介绍
一、数据仓库(ETL)
数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support)【将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节】。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层—源数据、数据仓库、数据应用:
ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、清洗(clear)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。
ELT工具:Kettle、Talend、Datastage、Informatica等
二、为什么用Informatica工具
借助Informatica全面、统一、开放且经济的数据管理平台,组织可以在改进数据质量的同时,访问、发现、清洗、集成并交付数据,以提高运营效率并降低运营成本。Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据管理 、数据质量、数据治理 、主数据管理、数据安全 和云数据集成等。
安装Informatica:https://blog.csdn.net/weixin_41685388/article/details/103574372
更多大数据/数据分析资料关注一下博客,一起学习交流!!!
数据仓库(ETL)、数据仓库工具Informatica介绍相关推荐
- 商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(二)
数据仓库 数据仓库定义:数据仓库是面向主题的.集成的.稳定的.反应历史变化的.随着时间的历史吧反应变化的数据集合. 数据仓库的特点: (1)面向主题:常规数据库主要是面向事务性处理,比如增删改查.数仓 ...
- 商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(三)
数据抽取.转换和加载,装载(ETL) (1)数据抽取:抽取是源数据进入数仓的第一步,每个业务系统不同,因此需建立不同的抽取.并进行下一步清洗.抽取目的,提供批处理服务(抽取流程启动,监控,作业调度抽取 ...
- 商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(一)
商业智能 什么是商业智能?什么样的企业需要商业智能?大家知道商业银行所涉及的系统非常之多,银行网点也非常之多,每家网点现金流入.流出每天都是不一样的,那么银行面临的问题出现了,如何平衡各网点现金流? ...
- 【数据仓库】数据仓库的介绍
一 数据仓库的概念 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH.数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合.它出于分析性报 ...
- 数据仓库ETL工具箱——实时ETL系统
建立实时ETL数据仓库的解决方案需要理解不同的整合技术,这个领域体现了具有新技术.新方法.新词汇的全新理念.通过选择合适的实时ETL技术.特征.方法来指导专业实验数据仓库构建实时ETL的四个过程: 调 ...
- 数据仓库介绍:什么是数据仓库、数据仓库功能、数据仓库价值、数仓领域职业发展方向规划
数据仓库介绍:什么是数据仓库.数据仓库功能.数据仓库价值.数仓领域职业发展方向规划 大家好,本次分享的主题是数据仓库,通过本次分享的目的,一个是帮助到初次接触大数据行业.或者想要了解大数据体系的伙伴, ...
- python名词解释数据仓库_python实现数据仓库ETL
通常讲的数据仓库ETL, 可以分为ETL和ELT两种实现方式. ELT是在加载到仓库后, 再做数据转换. ETL 是在加载之前完成转换, 落地的数据就是转换后的样子了. ELT多使用在MPP架构的 ...
- 数据仓库ETL工具箱——清洗和规范化(一)
在ETL系统中,数据的抽取和加载只是改变了数据的格式和数据的位置,而真正改变数据价值的恰恰是清洗和规范化的步骤,这对于数据能否用于预期目标起了决定性的作用.清洗和规范化包含三个重要的可提交内容: 数据 ...
- 清晰的数据仓库ETL流程(有干货)
数据仓库ETL流程 整体思路 具体步骤 1.工具 2.流程 3.小结 总结 整体思路 要想开发一个完整的数据仓库etl流程必须先从整个项目的结构层次入手,逐个剖析每一层的程序,在纸上画出整个的流程图, ...
最新文章
- 商贸通服装鞋帽版客户端无法连接服务器的问题(自己遇到的,已解决)
- edgeR基因表达差异分析
- 活用sersync实时采集日志
- 信息系统管理整体管理过程
- 安卓逆向_12 --- jeb工具的使用 ( 动态调试 smali 代码 【 普通调试 和 debug调试 】)
- scara机器人本体介绍
- 菜鸟学习笔记:Java提升篇2(容器2——Map、Set、迭代器)
- 如何检查列表是否为空?
- Android开发笔记(一百四十六)仿支付宝的支付密码输入框
- macOS Big Sur中“通知中心”的小组件
- 南京邮电大学《管理学原理C》2019/2020 学年第 2 学期期末试卷
- 软体机器人空间感知技术综述
- GMM-HMM语音识别
- 层次方框图、Warnier图、IPO图
- 电路设计_物联网芯片资讯——GPRS
- win10虚拟机安装linux
- 求int所能表示的最大整数
- 985大学计算机国赛,盘点通往985、211院校的108条路,总有一条适合你的
- 读何敬才同志的哀祭诗
- 战胜主导设计:一个整合性的分析框架