商业智能BI中有许多定义,诸如数据仓库、数据挖掘、OLAP等,还有一个不得不提的定义,那就是ETL。在BI工程师或相关的职位招聘中,ETL也是必不可少的一项技能。那么,ETL到底是什么呢?

ETL 的英文全称叫做 Extraction(抽取),Transformation(转换),Loading(加载)。

抽取主要是针对各个业务系统及不同服务器的分散数据,充分理解数据定义后,规划需要的数据源及数据定义,制定可操作的数据源,制定增量抽取和缓慢渐变的规则。

转换就是指数据的清洗、合并、拆分、加工、数据逻辑计算处理的过程,通常会按照一定的业务逻辑规则进行计算,最后转换成符合业务模型、分析模型的规范性的数据。简单来说,不管是大数据、小数据,都是将不规范的、不可分析的转换成规范的、可分析的数据。转换是ETL中花费时间最长的部分,一般情况下工作量是整个ETL的2/3。

加载主要是将经过转换的数据加载到数据仓库里面,可以通过直连数据库的方式来进行数据加载,可以充分体现高效性。在应用的时候可以随时调整数据抽取工作的运行方式,可以灵活的集成到其他管理系统中。

ETL的目的是将企业中分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。 ETL是商业智能BI项目重要的一个环节。通常情况下,在BI项目中ETL会花掉整个项目的1/3的时间,ETL设计的好坏直接关系到BI项目的成败。

ETL是实现BI的基础,因为保证了数据的质量与正确性。如果质量出现问题,最后的报表做出来也是错的。

市面上很多商业智能BI工具并不自带ETL,而是搭配开源ETL。这样可能会节省一部分费用,但是一旦出现问题就比较麻烦,用户需要将问题反馈到开源社区等待处理,在等待处理的过程中可能会浪费大量的时间,反而得不偿失。亿信ABI就是一款自带ETL的商业智能BI工具。其数据整合功能充分结合了大量项目人员的实施习惯,在整个数据建模的过程中,可以快速创建ETL过程和构建数据模型,操作简单,敏捷易用,提高效率,降低实施难度。

etlgr是什么服务器_商业智能BI中的ETL到底是什么?相关推荐

  1. 戏说数据仓库,商业智能BI中数据仓库的本质是什么?

    平时和朋友聊天,一谈到商业智能BI总是离不开数据仓库,有很多人不太明白数据仓库到底在商业智能BI项目中有什么作用,对数据仓库的作用有些争论,所以今天来聊聊数据仓库,探讨下数据仓库的真正用处. 数据仓库 ...

  2. 深度剖析商业智能BI中的多维分析

    数据在这些年的时间中,也逐渐成长为了个人.机构.企业乃至国家的战略资源,被很多人放到"新时代的石油"这一位置上.虽然这个说法也引起了一些争议,但更多只是讨论数据和石油的差异性,却并 ...

  3. etlgr是什么服务器_什么是ETL?算了,你可能不懂

    图片源自网络 ETL是将业务系统的数据经过抽取.清洗转换之后加载到数据仓库的过程,目的是将企业中的分散.零乱.标准不统一的数据整合到一起,为企业的决策提供分析依据. ETL是BI项目重要的一个环节.通 ...

  4. 商业智能BI中,业务质量分析和业务成本分析

    最初谁也没有想到,信息化 .数字化技术及其应用能够在如此短时间内快速覆盖了社会的方方面面,如今人们的衣食住行和工作生活娱乐都离不开数字化.数据的身影. 数据分析,是离不开业务的,只有把业务研究好了,所 ...

  5. bi power 两个日期挑较早的日期_功率 BI 中的时间智能:利用时间

    概述 了解时间智能功能在 Power BI 中的重要性 通过简单示例在 Power BI 中实现时间智能函数 介绍时间是企业的资产,就像资源.材料和资金一样.企业使用累积时间计算(年到日期.月到日期或 ...

  6. python中mod是什么意思_【python中,mod_python到底做了些什么呢?】mod python 教程

    python 编程小白 ,不会用doctest 请大神指教怎么用!! >>> >>> def is_between(v, lower, higher): ...   ...

  7. Hadoop技术在商业智能BI中的应用

    Hadoop是个很流行的分布式计算解决方案,是Apache的一个开源项目名称,核心部分包括HDFS及MapReduce.其中,HDFS是分布式文件系统,MapReduce是分布式计算引擎.时至今日,H ...

  8. visual studio odbc数据源设计器_商业智能BI应该支持哪些类型的数据源?

    ​数据源顾名思义,数据的来源,指的是数据库应用程序所使用的数据库或者数据库服务器.作为数据分析系统,BI应该支持多个数据源.这主要是因为一个公司可能同时拥有不同格式的数据.而且每个公司的数据保存格式都 ...

  9. etlgr是什么服务器_什么是数据ETL

    展开全部 ETL,是英文e5a48de588b662616964757a686964616f31333431363663Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽 ...

最新文章

  1. 使用let替换var实现块级作用域的小发现
  2. mysql事务拼写_拼写mysql单词
  3. 5.QML动画——分组动画
  4. 计算机尖端技术,不可思议的尖端技术:Top10
  5. P2742-二维凸包/圈奶牛Fencing the Cows【凸包】
  6. CodeIgniter配置之config
  7. 论文浅尝 | 面向视觉常识推理的层次语义增强方向图网络
  8. VB.NET Visual Basic
  9. 给 console 添加颜色
  10. maven编译时出现读取XXX时出错invalid LOC header bad signature
  11. Linux 挂载和卸载U盘
  12. 【转】PP模块快速入门之功能简介
  13. 直接下载Google Play上APP的安装包
  14. 1. Xamarin开发入门
  15. python批量合并txt文件内容,Python 批量合并多个txt文件的实例讲解
  16. Canvas 炫彩小球
  17. 如何切换到root用户
  18. 神经元树突、早期、突触及神经元标志物
  19. HTML5技术:促使浏览器替代原生态应用
  20. 合肥python 培训

热门文章

  1. JAVA基本数据类型及练习题
  2. 2021-08-25 多模态反讽识别系列文章阅读(二)
  3. 你真的需要一个(专门的)向量数据库么
  4. SharePoint Online规划(一)
  5. pymysql数据库的水果店销售系统之客户端1.0
  6. teacher-student network
  7. Golang 基础知识(九.func函数)
  8. 学生HTML个人网页作业作品——腾讯游戏官网HTML+CSS+JavaScript web课程设计网页规划与设计 网页设计成品DW静态网页 Web大学生网页成品 web网页设计期末课程大作业
  9. 色彩静物画法:先找体积再塑造细节~
  10. Future 的主要功能是什么?