Python+大数据-数仓实战之滴滴出行(二)

1. 数据转移

#验证sqoop是否工作
/export/server/sqoop-1.4.7/bin/sqoop list-databases \
--connect jdbc:mysql://192.168.88.100:3306/ \
--username root \
--password 123456

2. MySQL建表

1:mysql创建目标数据库和目标表#创建目标数据库create database if not exists app_didi;#创建订单总笔数目标表create table if not exists app_didi.t_order_total(order_date date,count int);导出订单总笔数表数据/export/server/sqoop-1.4.7/bin/sqoop export \--connect jdbc:mysql://192.168.88.100:3306/app_didi \--username root \--password 123456 \--table t_order_total \--export-dir /user/hive/warehouse/app_didi.db/t_order_total/month=2020-042.在mysql中创建目标表create table if not exists app_didi.t_order_subscribe_name_count( date_val date comment '日期', subscribe_name varchar(20) comment '预约和非预约名字',total_cnt int comment '订单数') ;sqoop导出/export/server/sqoop-1.4.7/bin/sqoop export \--connect jdbc:mysql://192.168.88.100:3306/app_didi \--username root \--password 123456 \--table t_order_subscribe_name_count \--export-dir /user/hive/warehouse/app_didi.db/t_order_subscribe_name_count/month=2020-04#创建不同时段订单统计目标表--1:在mysql创建目标表create table if not exists app_didi.t_order_timerange_total(order_date date ,timerange varchar(20) ,count int );--2:sqoop导出/export/server/sqoop-1.4.7/bin/sqoop export \--connect jdbc:mysql://192.168.88.100:3306/app_didi \--username root \--password 123456 \--table t_order_timerange_total \--export-dir /user/hive/warehouse/app_didi.db/t_order_timerange_total/month=2020-04#创建不同地域订单统计目标表--1:在mysql创建目标表create table if not exists app_didi.t_order_province_total(order_date date ,province varchar(20) ,city varchar(20),count int );--2:sqoop导出/export/server/sqoop-1.4.7/bin/sqoop export \--connect jdbc:mysql://192.168.88.100:3306/app_didi \--username root \--password 123456 \--table t_order_province_total \--export-dir /user/hive/warehouse/app_didi.db/t_order_province_total/month=2020-04#创建不同年龄段,不同时段订单目标表--1: 在mysql创建目标表create table if not exists app_didi.t_order_age_and_time_range_total(order_date date ,age_range varchar(20) ,order_time_range varchar(20) ,count int );--2:sqoop导出/export/server/sqoop-1.4.7/bin/sqoop export \--connect jdbc:mysql://192.168.88.100:3306/app_didi \--username root \--password 123456 \--table t_order_age_and_time_range_total \--fields-terminated-by '\t' \--export-dir /user/hive/warehouse/app_didi.db/t_order_age_and_time_range_total/month=2020-04

Python+大数据-数仓实战之滴滴出行(二)相关推荐

  1. Python+大数据-数仓实战之滴滴出行(一)

    Python+大数据-数仓实战之滴滴出行(一) 1. 项目架构图 1.1 数据流程处理 1.2 数仓分层 1.3 创建数据库 在Hive中创建数据库-- 创建ods库 create database ...

  2. Python + 大数据 - 数仓实战之智能电商分析平台

    Python + 大数据 - 数仓实战之智能电商分析平台 1. 项目架构 2. 数据仓库维度模型设计-事实表 事实表的特征:表里没有存放实际的内容,他是一堆主键的集合,这些ID分别能对应到维度表中的一 ...

  3. 滴滴出行大数据数仓实战

    我正在参加年度博客之星评选,请大家帮我投票打分,您的每一分都是对我的支持与鼓励. 2021年「博客之星」参赛博主:Maynor大数据 (感谢礼品.红包免费送!) https://bbs.csdn.ne ...

  4. 【大数据数仓项目集群配置 一】

    本文用于记录我的第一次内网大数据集群配置过程. 本篇主要实现基础配置. 配置使用的软件版本和脚本参考自尚硅谷,链接如下: 链接: https://www.bilibili.com/video/BV1r ...

  5. 大数据数仓建模(3)

    大数据数仓建模(3) 2.2.6 人员配置参考 1.旁敲侧击的问你到底做过没有 2.你们大概规模,数据量 1整体架构 属于研发部/技术部/数据部/基础平台部,我们属于大数据组,其他还有后端项目组,前端 ...

  6. 大数据/数仓面试灵魂30问

    1.什么是数据仓库?如何构建数据仓库?(如果这个问题回答的好,后面很多问题都不需要再问) 2.如何建设数据中台?可简单说下理解与思路 3.数据仓库.数据中台.数据湖的理解 4.传统数仓的程度(建模工具 ...

  7. 大数据/数仓面试灵魂30问(转)

    1.什么是数据仓库?如何构建数据仓库?(如果这个问题回答的好,后面很多问题都不需要再问) 2.如何建设数据中台?可简单说下理解与思路 3.数据仓库.数据中台.数据湖的理解 4.传统数仓的程度(建模工具 ...

  8. 大数据数仓高级面试题整理

    大家好,给大家整理了一下大数据数仓高级面试题,希望大侠们能够喜欢. 数仓高内聚低耦合是怎么做的 定义 高内聚:强调模块内部的相对独立性,要求模块内部的元素尽可能的完成一个功能,不混杂其他功能,从而使模 ...

  9. 大数据数仓建模 - 维度建模 实战及思路过程 (两年数仓建模经验 纯干货)

    数仓维度建模 维度建模方法论: 维度建模 是以业务过程为驱动 先确定某些业务过程 围绕业务过程去建立模型 通常采用自底向上的方法 从明确关键业务过程开始 再到明确粒度 再到明确维度  最后明确事实 在 ...

最新文章

  1. (转载)动态SLAM系统:VDO-SLAM!
  2. 【已解决】mysql连接出错:ERROR 1040 (HY000): Too many connections
  3. NGINX(一)内存结构
  4. 设置VMware随系统开机自动启动并引导虚拟机操作系统
  5. python封装c++接口_使用MetaSIP自动生成SIP封装C++到Python接口
  6. C++PrimerPlus学习——第十三章编程练习
  7. 开源 java CMS - FreeCMS2.3会员我的简历
  8. 转载 LDAP Schema Design
  9. MongoDB数据库去重
  10. python实现pdf阅读器_PyQt5 从零开始制作 PDF 阅读器(一)
  11. linux 查看裸设备与lv,LINUX 如何查看裸设备
  12. 元宇宙场景技术实践|实现“虚拟人”自由
  13. 开发WP版本的大菠萝英雄榜
  14. Java内存模型(JMM的原理和介绍)
  15. 艾永亮:刘昊然盲盒、大白兔润唇膏,95后推动超级产品IP的发展
  16. java版我的世界MITE怎么下_我的世界mite作弊图文教程
  17. 人脸识别API接口概述
  18. ‘gbk‘ codec can‘t decode byte 0xad in position 2: illegal multibyte sequence 错误的解决方法
  19. 在微信小程序中,使用wxParse插件解析HTML/md富文本
  20. 【学习笔记】GPS原理及数据处理(快速静态定位中的整周模糊度确定,FRAR和LAMBDA)

热门文章

  1. 国外java_Java开发必知道的国外10大网站
  2. [04]Web前端进阶—JS伪数组
  3. QGC源码分析——航向规划中航点编辑流程(QGroundControl)
  4. macos各版本汇总
  5. 中集飞瞳多式联运智能化方案海铁运输数字化集装箱管理,多式联运智能化铁路智能多式联运,中集集团高科技中集飞瞳多式联运智能化领军者
  6. 解决电脑某个盘可用容量小于该盘总容量减去盘内所有文件大小总和
  7. 学习opencv:PS滤镜—浮雕
  8. android视频适配与裁剪
  9. js中 0 +0 -0 有什么区别?
  10. 公众号平台的H5实现微信授权登录