小A以前是一名数据仓库工程师,现在他是数据仓库仓库➕数据分析……

by小AA

数据仓库知多少

首先,来了解一下数据仓库吧!数据仓库是一个面向主题的、集成的、相对稳定的、反应历史变化的数据集合。

我们来看这几个词:

  • 面向主题,数据仓库会规划各种业务主题,所以我们需要理解各大主题的范畴以及之间的关系,这样就了解了数据仓库的基本架构。

  • 集成,数据仓库的数据会来自各个业务系统数据或者外部爬取数据,所以需要我们知道每个数据仓库的模型字段都是来自哪个源,这样我们就能快速全面的了解相关业务。

  • 相对稳定,数据仓库的数据一般不会实时变化,所以我们今天看去年的数据和明天看去年的数据是一样的,如果我们发现某一个月度数据不对,就可能需要重新汇总历史月份每天的数据(请理解数数仓小伙伴们没及时给你数据)

  • 反应历史变化,这就是为什么预测一般就需要数据分析师们大显身手了。

如何利用数据仓库优化数据分析

首先数据分析又是干什么的呢?基于业务需求,结合历史数据,利用相关统计学方法和某些数据挖掘工具算法对数据进行整合、分析,并形成一套最终解决某个业务场景的方案(刚入门数据分析的浅显思考)。

听团队小伙伴说,在数据分析的过程中有大部分的工作都是在处理数据(大部门分我认为是60%工作量),所以为了提高工作效率和质量,借助数据仓库进行数据分析无疑是一个很好的选择。

如何来使用数据仓库呢?

  • 了解原始数据,想要真正地理解指标,你必须了解原始明细数据,知道是哪里来的,经过了怎样维度的计算得到的。

  • 寻找“干净”数据,数据分析要求数据都是“干净的”(可以作为算法特征输入),而数据仓库中的模型一般都符合你的要求。我们需要找到“干净的”模型,但事实往往不会很顺利,我们需要找到相近的数据,然后自己找到之间同的“纽带”(关联条件)汇总数据。

  • 反馈数据,数据分析在做完整个分析方案后,可以和数据放仓库小伙伴一起分享成果,让数据仓库同事学习数据分析思路的同时,也可以更好地规划模型,从而进入良性循环。

数据仓库和数据分析都存在的组织架构在很多大团队会有,很多小团队是没有专门的数据分析人员或者数据仓库人员的,二者是合为一体的。

作为一个数据分析猿,你都用哪些数据处理手段,或者对数据仓库需要到怎么的理解程度,可以留言告诉我,一起探讨!

面试,如何使用数据仓库?相关推荐

  1. 面试问题准备-数据仓库建模篇

    1. 什么叫数据仓库?数据仓库的特点? (相信inmon的数据仓库概念的四个特点是最基本的吧,当然需要加上自己的理解) 首先,用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库: 其次, ...

  2. 数据仓库高级工程师 字节跳动面试

    本人面试的是 数据仓库高级工程师–推荐系统,从官网投的校招,2020年底最后一天发的简历,元旦假三天,四号早上来了通知 以下是面试题,希望有帮助 1.自我介绍 挑重点,与面试职位无关的经历不要说,除非 ...

  3. 关于本博客数据仓库方面的原创文章汇总

    <!-- [endif]--> 关于数据仓库方面的文章汇总 我的数据仓库之路! 关于数据仓库维度处理的系列文章 1 关于数据仓库维度数据处理的方法探究系列-- 维的概述 2 关于数据仓库维 ...

  4. 招银网络科技笔试面试

    昨晚收到招银的面试通知,面试岗位:数据仓库.这两天准备下笔试.面试,网上搜了些资料,记录在这里: 一.上图所示数据库开发答案解析如下: --建表---------------------------- ...

  5. 1024程序员节,一份精华合辑送给你

    点击蓝色"有关SQL"关注我哟 加个"星标",天天与10000人一起快乐成长 写在前面 今天,10月24日. 对于程序员来说,这天意义非凡.我的公众号,提供了一 ...

  6. 数据仓库工程师面试经验(2019)

    所有面试的前奏: 先简要的介绍一下自己! 这句话基本上是所有面试官问的第一个问题,这个问题我的应对策略是: 1. 简要介绍何时毕业于哪所学校(姓名,籍贯可选择) 2. 从近往远介绍开始介绍工作经验 3 ...

  7. etl工程师 面试题_关于数据仓库工程师的一般面试题目

    相信会对即将投身于数据仓库事业中的同行们有点帮助!不过这只是针对初级数据仓库工程师的基本问题. 本题只代表自己对数据仓库的肤浅认识,不代表任何公司的面试题目. 对于高级数据仓库工程师的问题更侧重于各种 ...

  8. 【面试】数据仓库面试经验总结

    目录 第一部分,自我介绍 第二部分,专业知识细问 第三部分,数据治理 第四部分,开发/代码能力 第五部分,个人性格测试 第一部分,自我介绍 通常面试官会让进行自我介绍,加项目经历介绍(大多数会按简历上 ...

  9. 2022年全新数据仓库面试总结大全

    数据仓库 一.数据仓库概述 首先,我们先来看下数据库.数据集市.数据仓库以及数据湖的概念. 1.什么是数据库? 数据库(Database)是按照一定格式和数据结构在计算机保存数据的软件,属于物理层. ...

  10. 数据仓库面试总结大全,深度解析底层逻辑

    数据仓库 一.数据仓库概述 首先,我们先来看下数据库.数据集市.数据仓库以及数据湖的概念. 1.什么是数据库? 数据库(Database)是按照一定格式和数据结构在计算机保存数据的软件,属于物理层. ...

最新文章

  1. python列表方法语句_Python中列表和元组的相关语句和方法讲解
  2. VTK:演示回调的用法实战
  3. 扑克牌图片一张一张_培养孩子的数学力,不妨试试这五个扑克牌游戏
  4. Constructor总结
  5. hdu区域赛在线热身赛 暨 第十二场组队赛
  6. ThinkPHP3.2.3快速入门 · 看云
  7. 漏洞挖掘、漏洞分析和漏洞利用
  8. 在 Linux 上配置一个 syslog 服务器
  9. Eclipse输入或创建txt文件位置
  10. 无线通信设备安装工程概预算编制_建筑安装工程,预算编制中易遗漏总结分享...
  11. 【重磅】Libra Credit 和Uphold 达成战略合作
  12. 谷歌浏览器插件打包ChromePackage-extention
  13. js:ajax post与get的区别,getjson的使用
  14. SaaS平台产品架构设计
  15. 如何在7段和16段LED显示屏中表示数字和字母?
  16. 设计模式之观察者模式、中介者模式、迭代器模式、访问者模式、备忘录模式、解释器模式
  17. 如何减少http请求
  18. APP瘦身大法--AndResGuard的使用
  19. matlab用jc法计算可靠度,用MATLAB实现JC法计算结构可靠度程序
  20. 全排列递归与非递归python实现

热门文章

  1. python网络爬虫:股票数据定向爬取
  2. react中key的作用
  3. python抖音上的视频_《我看抖音都出3分钟的视频了,怎么做到的》 python抖音视频上传...
  4. BSCI认证咨询,2021年开始BSCI上新平台系统,旧平台系统停止使用
  5. 灵性图书馆:好书推荐-《灵魂出体》
  6. VS2017的下载地址和安装教程(图解版)
  7. 思维:分析框架化,模型化
  8. word里面文献连续引用的设置方法
  9. (重装mysql)在处理时有错误发生: mysql-server-5.7 mysql-serverE: Sub-process /usr/bin/dpkg returned an error c
  10. Socket通信bind错误