什么是BI、什么是ETL?一篇文章告诉你
BI是什么?
商业智能(Business Intelligence,简称:BI),又称商业智慧或商务智能,指用现代数据仓库技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。听起来好高大上啊,憧憬着自己如何挥斥方遒,为公司提供数据分析以支持决策。
什么是BI工程师?
商务智能工程师是商业智能行业的工程师。从需求分析师到数据仓库架构师、ETL工程师、数据分析工程师、报表开发工程师、数据挖掘工程师等,都可以称为BI工程师。
什么是ETL工程师?
ETL工程师 也称为数据库工程师:主要从事系统编程、数据库编程与设计。
ETL是什么?
ETL 的英文全称叫做 Extraction 抽取,Transformation 转换,Loading 加载。
抽取就是指将数据从一个数据源、或者多个数据源抽取过来的动作,数据源有可能是关系型数据库,也可能是文本文件,或者一个程序的API接口。
转换就是指数据的清洗、合并、拆分、加工、数据逻辑计算处理的过程,通常会按照一定的业务逻辑规则进行计算,最后转换成符合业务模型、分析模型的规范性的数据。简单来说,不管是大数据、小数据,都是将不规范的、不可分析的、转换成规范的、可分析的数据。
加载就是将转换的结果按照分析模型需要的格式将数据写入到目标表,这些目标表就是业务自助分析的数据来源,通过是按照一定建模的方式来组织的,不管是星型分析模型还是雪花型分析模型都是的。
这就是在 BI 中我们通常定义的ETL处理过程。
非面向BI的ETL?
也有另外的一种ETL,不是面向数据分析的,而是纯数据的处理,比如数据库的数据迁移,多数据源的数据迁移,这是纯数据的开发,用途不一定是面向BI,可能是业务系统之间的数据转换处理。像我们之前的一个很大的项目,原有的ERP是用Cobal语⾔开发的,后面也是因为业务的发展需要使用新的ERP系统,因此就需要把原有ERP的文件格式类型的数据按照新的业务规则、新的ERP对业务表的定义将原有系统的数据抽取到新的平台,这个过程处理非常的复杂。
ETL都需要做什么?
对于一个大项目,涉及到上千张表的数据处理,光存储过程我们写了上千个,ETL包几百个,因此就需要对ETL的架构做完整的规划和涉及,这就到了ETL架构师的阶段,需要对数据、ETL甚程程序开发思维都有较高的要求。比如异常数据的处理、错误数据的恢复、多批次的ETL包处理管理、几十个开发人员同步开发中的项目管理等。
ETL通常通过什么方式或者工具来实现呢?
基本上都是SQL语句加上一些便捷的ETL工具,比如像商业性的ETL工具,Informatica、微软的SSIS、IBM DataStage等等,也有开源的像Pentaho Kettle 等等。无论使用什么样的工具,对数据理解的要求,对SQL技术的要求都是必备的基础,也是作为一个ETL工程师必备的入门条件。
什么是BI、什么是ETL?一篇文章告诉你相关推荐
- 一篇文章告诉你标准化和归一化的区别?
一篇文章告诉你标准化和归一化的区别? 2019-02-28 17:12:39 融融网融融网阅读量:484 进一步推进企业的标准化工作,使之发展水平适应经济全球化下市场竞争的要求,促进企业综合实力的提升 ...
- 一篇文章告诉你如何成为数据科学家
文章讲的是一篇文章告诉你如何成为数据科学家,通常来说,年轻人都很容易立志成为什么,例如成为一名科学家,然后又很快放弃.这一方面是因为摆在他们面前的诱惑太多,也因为成为一名科学家真的很不容易. 这一点放 ...
- 【ArcGIS风暴】什么是点云?什么是Las数据集?一篇文章告诉你点云数据的奥秘
摄影测量Pix4d等软件,或激光雷达数据一般都是LAS格式的点云数据,有很大的适用范围和优点,那么,到底什么是LAS数据集呢,一文告诉你LAS数据集的来龙去脉. 扩展阅读: 什么是点云?什么是Las数 ...
- 运营商大数据怎么获客的?一篇文章告诉你
运营商大数据怎么获客的?一篇文章告诉你 现在各种各样的广告营销越来越难即便精准如百度竞价,好多访客也只是看看就走开了,浪费了大量的推广费用,想知道客户的联系方式好做二 ...
- 【一篇文章告诉你网格策略从理论到实盘的所有内容(python实现)】
一篇文章告诉你网格策略从理论到实盘的所有内容 名词定义 什么是网格策略 现货网格的基本参数 等差网格以及等比网格 什么是网格的价格中枢以及目标仓位 无常损失的与业绩计算 需要"市价补仓&qu ...
- lcl手术和飞秒区别_一篇文章告诉你,ICL与全飞秒近视手术的区别在哪?
原标题:一篇文章告诉你,ICL与全飞秒近视手术的区别在哪? >>近视眼的痛,你体会过么? 戴眼镜给外表减分.隐形眼镜护理麻烦 升学.参军.找工作受限 还要时刻警惕 随时存在的视网膜脱离.青 ...
- 《看聊天记录都学不会C语言?太菜了吧》(7)下一篇文章告诉你牛郎是谁
若是大一学子或者是真心想学习刚入门的小伙伴可以私聊我,若你是真心学习可以送你书籍,指导你学习,给予你目标方向的学习路线,无套路,博客为证. 本系列文章将会以通俗易懂的对话方式进行教学,对话中将涵盖了新 ...
- 线上python课程一般多少钱-python培训班一般多少钱?一篇文章告诉你
如今,职场竞争越来越激烈.如果不学习一两项新技能并不断更新你的知识,很容易被年轻一代超越.很多人开始学习python.那么,python培训班一般多少钱? Python语法简洁,代码十分接近人类的自然 ...
- 一篇文章告诉你如何在报表系统中实现自动生成Word报告
点击获取ActiveReports v14.0最新版下载 在报表系统中,生成Word报告的常见步骤分为以下四步:采集原始数据.值后台传递.生成最终报告模板.实现打印和预览.可见,系统在生成报告之前,需 ...
- 区块链简史(一):一篇文章告诉你,区块链的前世今生
欢迎来到懒区块,本文由懒区块整理撰写,不经过允许,切勿转载.本系列有十二篇文章,这十二篇文章介绍了区块链技术的简史.应用.预测和展望.您的每一次关注.转发.收藏都是我们更新优质内容的源动力. 谈起区块 ...
最新文章
- 项目微管理13 - 新人
- ESP8266 wifi干扰、钓鱼实现
- 使用go开启一个能够提供给html的a标签的下载的后端
- flash遨游缓存问题
- 苹果cms V10模板 仿优酷网PC模板+wap模板
- 解决DesignMode不能正确反应是否处于设计模式的问题
- PHP 生成 ppt,PHP导出PPT方法,PowerPoint/PhpPresentation处理
- 真彩色与伪彩色的概念
- Python之进制转换大全详解
- Vue——商品详情页(未完,写着以免忘掉)
- Java中的时间、时区和夏令时
- java.Net.UnknownHostException异常处理的方法
- @Scheduled注解与参数
- 无线电视服务器主机名,电视服务器主机名怎么填
- 看完这篇文章你还敢说不知道多线程是什么?
- Java设计模式-代理模式笔记
- Mac Outlook左侧文件夹不见了,怎么处理?
- 微信支付银行卡交易的限额是多少?
- 韩寒 一个 新版本 android 收藏,韩寒“One·一个”最新版将上线 腾讯应用宝首发...
- js 求最接近5的倍数的值