2019独角兽企业重金招聘Python工程师标准>>>

数据源:业务数据库,如:mysql,埋点数据(XA分发到kafka的topic-->flume-->hdfs---->MR程序解析到HDFS-->HIVE外表关联)。

数据仓库各层(stg-ods-mid-dm-fm):数据图书馆,数据整合

数据应用层:MYSQL,HBASE,es

应用:数据分析,数据挖掘知识   学习机器学习知识

其中涉及的技术:

0、hadoop集群知识

1、shell知识

2、HBASE知识

3、hive知识

4、kafka topic知识

5、flume配置

6、java知识,MR编写

7、zookeeper知识

------------------------------------------------

数据仓库的代码框架:

1、数据仓库需要考虑两个问题,1、指定日期,支持重跑;2、连续跑好几天;

需要用到的shell:

1、日期处理语句

去年:echo -e  `date --date="2018-12-20 -1 year" +%Y-%m-%d`

上月:echo -e  `date --date="2018-12-20 -1 month" +%Y-%m-%d`

昨日:echo -e  `date --date="2018-12-20 -1 day" +%Y-%m-%d`

2、打日志

echo  有两个参数 -e -n

echo -e 处理特殊字符

若字符串中出现以下字符,则特别加以处理,而不会将它当成一般文字输出: 
\a 发出警告声; 
\b 删除前一个字符; 
\c 最后不加上换行符号; 
\f 换行但光标仍旧停留在原来的位置; 
\n 换行且光标移至行首; 
\r 光标移至行首,但不换行; 
\t 插入tab; 
\v 与\f相同; 
\ 插入\字符; 
\nnn 插入nnn(八进制)所代表的ASCII字符;

转载于:https://my.oschina.net/u/3267050/blog/3002573

数据仓库流程和代码说明相关推荐

  1. 数据仓库流程架构(一)

    数据仓库流程&架构(一) 定义 数据仓库是逻辑上的概念,是一个数据集合. 数据仓库中的数据有这两个特点: - 最全的历史数据(海量): - 相对稳定的:不同于业务系统数据库,数据经常会被更新. ...

  2. 【Go API 开发实战 3】API 流程和代码结构

    API 流程和代码结构 为了使读者在开始实战之前对 API 开发有个整体的了解,这里选择了两个流程来介绍: HTTP API 服务器启动流程 HTTP 请求处理流程 本小节也提前给出了程序代码结构图, ...

  3. php做一个微信退款,PHP实现微信申请退款流程实例代码

    前面讲了怎么实现微信支付,详见博文:php实现微信支付(jsapi支付)流程  和ThinkPHP中实现微信支付(jsapi支付)流程.由于业务需求,还需要有微信退款,经过研究和摸索,也终于搞定了. ...

  4. Task01:熟悉新闻推荐系统的基本流程(代码复现)

    Task01:熟悉新闻推荐系统的基本流程 0.代码版本 1.系统信息 2.`python`环境 3.`MySQL`数据库 4.`MongoDB` 5.`Redis` 6.`Node.js` 7. 复现 ...

  5. 煤炭价格预测:基于matlab的时间序列分析(主要流程+完整代码)

    基于matlab的时间序列分析(主要流程+完整代码) 案例简介 时间序列简介 平稳时间序列{xt} ARIMA=AR+MA+INTEGRATER 实例应用 数据平稳化 模型选择--确定p.q ACF/ ...

  6. 双重差分模型能做固定效应吗_stata中双重差分操流程及代码

    原标题:stata中双重差分操流程及代码 一.简介 现代计量经济学和统计学的发展为我们的研究提供了可行的工具.倍差法来源于计量经济学的综列数据模型,是政策分析和工程评估中广为使用的一种计量经济方法.主 ...

  7. 全流程低代码物联网平台IoT-Fast教你对接labVIEW

    导读:IoT-Fast是一款全流程低代码物联网平台,提供了丰富的设备采集控制协议(Modbus RTU 串口.Modbus TCP 网口.通用 OpcUa 通讯协议.西门子 S7 通讯协议.三菱 Fx ...

  8. Web组态——新一代全流程低代码物联网平台

    先上图,实际完成效果: Q:那么以上场景是用什么实现的呢? A:IoT-Fast是一款全流程低代码物联网平台,提供了丰富的设备采集控制协议(Modbus RTU 串口.Modbus TCP 网口.通用 ...

  9. MATLAB仿真作图的流程与代码结构-经验总结

    文章目录 流程简述 代码结构 1.第一部分:加载数据 2.第二部分:仿真计算 3.第三部分:绘图 命名规则 流程简述 在长期编写matlab代码中总结出得经验:通过一个合理的流程来写MATLAB代码, ...

最新文章

  1. 不用asp.net MVC,用WebForm照样可以实现MVC(请看最后一句话)
  2. EPUB CFI 规范
  3. 如何在家写出一份无懈可击的产品文档
  4. c 求最小公倍数_公务员备考-最小公倍数和最小公约数问题
  5. 推荐曹济的FPA培训课程
  6. 像孩童一样欣喜的看着自己的成长
  7. NSString的几种常用方法
  8. matlab 保存不了文件,关于matlab文件无法保存的原因(转)
  9. python判断闰年_python如何判断闰年
  10. 无线网络经常掉线的解决办法
  11. system32 下exe文件的作用
  12. 从0到1,看职场小白如何用H5编辑器实现自我逆袭!
  13. MISC隐写——图片
  14. serviceBattery mac换电池 mac怎么换电池mac拆机
  15. 【akka】初识Akka 简单介绍
  16. 如何快速搭建一个像“天猫精灵”的智能语音助手?
  17. 如何修复win7蓝牙服务器,恢复Windows7系统超便捷蓝牙连接
  18. 客户信用风险预测——基于logit模型
  19. 网络流量监控器mrtg全攻略
  20. superset登陆网面Internal Server Error

热门文章

  1. Linux 安装MySql 5.7.21 操作步骤
  2. C/S模型之TCP协议
  3. HDU1878欧拉回路
  4. 10.28-11.1-广州软件所-实习工作日记
  5. KM算法 详解+模板
  6. [Data Pump]expdp导出笔记
  7. Vue简单入门及组件的简单使用
  8. android os FileUriExposedException file storage emulated 0 test tx
  9. java 中对hashmap进行排序
  10. 织梦新建顶级栏目打不开,解决办法