一、数据仓库(ETL)

数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision-Support)【将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据, ETL是BI(商业智能)项目重要的一个环节】。其实数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何的数据,数据来源于外部,并且开放给外部应用,这也是为什么叫“仓库”,而不叫“工厂”的原因。因此数据仓库的基本架构主要包含的是数据流入流出的过程,可以分为三层—源数据、数据仓库、数据应用:

ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、清洗(clear)、转换(transform)、加载(load)至目的端的过程。ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

ELT工具:Kettle、Talend、Datastage、Informatica等

二、为什么用Informatica工具

借助Informatica全面、统一、开放且经济的数据管理平台,组织可以在改进数据质量的同时,访问、发现、清洗、集成并交付数据,以提高运营效率并降低运营成本。Informatica平台是一套完善的技术,可支持多项复杂的企业级数据集成计划,包括:企业数据集成、大数据管理 、数据质量、数据治理  、主数据管理、数据安全 和云数据集成等。

安装Informatica:https://blog.csdn.net/weixin_41685388/article/details/103574372

更多大数据/数据分析资料关注一下博客,一起学习交流!!!

数据仓库(ETL)、数据仓库工具Informatica介绍相关推荐

  1. 商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(二)

    数据仓库 数据仓库定义:数据仓库是面向主题的.集成的.稳定的.反应历史变化的.随着时间的历史吧反应变化的数据集合. 数据仓库的特点: (1)面向主题:常规数据库主要是面向事务性处理,比如增删改查.数仓 ...

  2. 商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(三)

    数据抽取.转换和加载,装载(ETL) (1)数据抽取:抽取是源数据进入数仓的第一步,每个业务系统不同,因此需建立不同的抽取.并进行下一步清洗.抽取目的,提供批处理服务(抽取流程启动,监控,作业调度抽取 ...

  3. 商业智能,数据仓库,ETL,数仓调度工具informatica介绍手账(一)

    商业智能 什么是商业智能?什么样的企业需要商业智能?大家知道商业银行所涉及的系统非常之多,银行网点也非常之多,每家网点现金流入.流出每天都是不一样的,那么银行面临的问题出现了,如何平衡各网点现金流? ...

  4. 【数据仓库】数据仓库的介绍

    一 数据仓库的概念 1 什么是数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH.数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合.它出于分析性报 ...

  5. 数据仓库ETL工具箱——实时ETL系统

    建立实时ETL数据仓库的解决方案需要理解不同的整合技术,这个领域体现了具有新技术.新方法.新词汇的全新理念.通过选择合适的实时ETL技术.特征.方法来指导专业实验数据仓库构建实时ETL的四个过程: 调 ...

  6. 数据仓库介绍:什么是数据仓库、数据仓库功能、数据仓库价值、数仓领域职业发展方向规划

    数据仓库介绍:什么是数据仓库.数据仓库功能.数据仓库价值.数仓领域职业发展方向规划 大家好,本次分享的主题是数据仓库,通过本次分享的目的,一个是帮助到初次接触大数据行业.或者想要了解大数据体系的伙伴, ...

  7. python名词解释数据仓库_python实现数据仓库ETL

    通常讲的数据仓库ETL, 可以分为ETL和ELT两种实现方式.  ELT是在加载到仓库后, 再做数据转换.  ETL 是在加载之前完成转换, 落地的数据就是转换后的样子了. ELT多使用在MPP架构的 ...

  8. 数据仓库ETL工具箱——清洗和规范化(一)

    在ETL系统中,数据的抽取和加载只是改变了数据的格式和数据的位置,而真正改变数据价值的恰恰是清洗和规范化的步骤,这对于数据能否用于预期目标起了决定性的作用.清洗和规范化包含三个重要的可提交内容: 数据 ...

  9. 清晰的数据仓库ETL流程(有干货)

    数据仓库ETL流程 整体思路 具体步骤 1.工具 2.流程 3.小结 总结 整体思路 要想开发一个完整的数据仓库etl流程必须先从整个项目的结构层次入手,逐个剖析每一层的程序,在纸上画出整个的流程图, ...

最新文章

  1. 商贸通服装鞋帽版客户端无法连接服务器的问题(自己遇到的,已解决)
  2. edgeR基因表达差异分析
  3. 活用sersync实时采集日志
  4. 信息系统管理整体管理过程
  5. 安卓逆向_12 --- jeb工具的使用 ( 动态调试 smali 代码 【 普通调试 和 debug调试 】)
  6. scara机器人本体介绍
  7. 菜鸟学习笔记:Java提升篇2(容器2——Map、Set、迭代器)
  8. 如何检查列表是否为空?
  9. Android开发笔记(一百四十六)仿支付宝的支付密码输入框
  10. macOS Big Sur中“通知中心”的小组件
  11. 南京邮电大学《管理学原理C》2019/2020 学年第 2 学期期末试卷
  12. 软体机器人空间感知技术综述
  13. GMM-HMM语音识别
  14. 层次方框图、Warnier图、IPO图
  15. 电路设计_物联网芯片资讯——GPRS
  16. win10虚拟机安装linux
  17. 求int所能表示的最大整数
  18. 985大学计算机国赛,盘点通往985、211院校的108条路,总有一条适合你的
  19. 读何敬才同志的哀祭诗
  20. 战胜主导设计:一个整合性的分析框架

热门文章

  1. TK1 R21.4 只更新kernel,不更新文件系统
  2. spring框架解析(全)
  3. 云队友丨风起云涌:腾讯转型十年记
  4. 【chrono】【chrono问题】【chrono的使用学习记录】【时间计时】
  5. pygame Sprite类(4)
  6. java动态分区分配算法,操作系统_动态分区分配算法课程设计_java版
  7. vue基础(主要为vue3)
  8. requests爬取微博
  9. Slam学习笔记——ROS踩坑记录
  10. 肠子的小心思(三):通往消化道的入口也很神奇