Aws云服务EMR使用

创建表结构

创建abc库下的abc_user_i表字段s3://abc-server/abc-emr/shell/ABC_USER_HIVE.q:

  • EXTERNAL 指定为外部表
  • partitioned by (createTime Date) 指定分区表,列名createTime
  • LOCATION '${INPUT}' 指定输出位置
CREATE EXTERNAL TABLE IF NOT EXISTS abc.abc_user_i (
devId STRING,
appId INT ,
paName STRING,
appVersion STRING,
appVercode STRING,
sdkVersion STRING,
sdkVerCode STRING,
phoneVersion STRING,
mac STRING,
source STRING,
content STRING,
logDate Date,
ip STRING
)
partitioned by (createTime Date)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ':'
LOCATION '${INPUT}';

添加步骤创建表:

hive的操作

# 创建分区:

  • location 指定 存储文件的具体位置 按日期存储的压缩包文件
  • 分区一个目录对应一条分区表
alter table abc.abc_user_i add partition (createTime='2017-10-20') location 's3://abc-server/abc-emr/InputDate/2017-10-20/';
alter table abc.abc_user_i add partition (createTime='2017-10-20') location 's3://abc-server/abc-emr/InputDate/2017-10-21/';
alter table abc.abc_user_i add partition (createTime='2017-10-20') location 's3://abc-server/abc-emr/InputDate/2017-10-22/';

# 查询已经创建的分区:

show partitions abc.abc_user_i;
createtime=2017-10-20
createtime=2017-10-21
createtime=2017-10-22

# 根据分区 查询结果:

hive> select count(*),createTime from abc.abc_user_i where createTime='2017-10-01' group by createTime;
Query ID = hadoop_20171102062813_7cccccxxx-c311-411e-de30-1xxxxaaaaa4
Total jobs = 1
Launching Job 1 out of 1
Status: Running (Executing on YARN cluster with App id application_1508122225619_0272)----------------------------------------------------------------------------------------------VERTICES      MODE        STATUS  TOTAL  COMPLETED  RUNNING  PENDING  FAILED  KILLED
----------------------------------------------------------------------------------------------
Map 1 .......... container     SUCCEEDED      1          1        0        0       0       0
Reducer 2 ...... container     SUCCEEDED      1          1        0        0       0       0
----------------------------------------------------------------------------------------------
VERTICES: 02/02  [==========================>>] 100%  ELAPSED TIME: 15.65 s
----------------------------------------------------------------------------------------------
OK
5404869 2017-10-01
Time taken: 17.211 seconds, Fetched: 1 row(s)

# 删除分区(外部表只会删除索引,不会删除数据;内部表会删除索引和数据):

alter table adsdk.adsdk_useraction_i drop partition(createTime='2017-10-24');

Hive创建外部表以及分区参考:
http://blog.csdn.net/csfreebird/article/details/27874943

转载于:https://www.cnblogs.com/baolin2200/p/7772309.html

Aws云服务EMR使用相关推荐

  1. 你所不知道的AWS 云服务清单(71种)

    导读 AWS,即亚马逊 Web 服务,是一个提供了一系列按使用计费的 web 服务的云平台. 它是迄今为止最为著名的云平台之一.由于其灵活性.有效性.弹性.可测量性和无须维护,所以有一些企业正逐步把他 ...

  2. aws云服务器会自动扣费吗,AWS云服务免费套餐竟然扣钱了?可能是因为你的region没管好...

    原标题:AWS云服务免费套餐竟然扣钱了?可能是因为你的region没管好 前面几篇文章我们已经介绍了,个人如何开通AWS海外账号,使用一年的AWS免费套餐. 并简单介绍了开通账号后,如何创建你的第一个 ...

  3. 日活四千万的汤姆猫游戏家族,用AWS云服务打造“无感”用户体验

    2020年7月,"会说话的汤姆猫"首款赛车类游戏<汤姆猫飞车>上线公测.它保持了汤姆猫游戏家族一贯的Q萌风格,赛道上一路都有萌宠陪伴,引领玩家进入奇妙的赛车世界.&qu ...

  4. 马云以2750亿财富第三次成为中国首富;扎克伯格:AWS云服务成本太高;小米否认冰箱由海尔代工 | EA周报...

    EA周报 2019年10月11日 每个星期7分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事.掌握IT核心技术. 热点大事件 任正非:鸿蒙最快1年即可媲美iOS和Android 据报道,华为创始人任正 ...

  5. 一篇文章浏览AWS云服务产品

    一篇文章浏览AWS云服务产品(原文) AWS云服务的产品有很多(如图一所示),每一种产品都有特殊用途,一般情况下我们需要将不同类型的产品组合在一起(如图二所示)才能够构建一个可扩展,高性能,可容错的系 ...

  6. AWS云服务认证攻略系列(一)AWS Certified Solution Architect Associate 考试经验分享

    2019年自己计划有个新开始,就是开始尝试写写博客啦. 首文献给AWS云服务认证主题~~~ 首先臭美一下,自己这次的AWS SAA考试分数比预想的要高一点,考试满分是1000分,自己拿到了893分,小 ...

  7. MAC 通过终端连接AWS云服务上的linux系统(Ubuntu)修改Html的标题

    先看结果截图 作业完成要求:(个人作业仅供参考) 方法:MAC 通过终端 连接AWS云服务上的linux系统(Ubuntu)修改Html的标题(修改成自己的名字) 1.直接进入课程地址:https:/ ...

  8. AWS云服务系统配置R studio及anaconda

    AWS云服务系统配置 使用EDU版AWS 云服务器,搭建数据分析.挖掘平台,安装R .python及其环境软件,仅供学习与参考. 1. R及R studio sever 的安装 1. 1 安装最新版的 ...

  9. AmazonS3(aws 云服务android sdk接入)

    参考 aws云服务文档 https://aws.amazon.com/cn/documentation/s3/ aws云服务实例代码 https://github.com/awslabs/aws-sd ...

最新文章

  1. tls 禁用重协商_TLS Https连接失败问题(协商失败)
  2. Object-C与Swift混合开发
  3. OpenCV中CV_IS_MAT_CONT(src->type dst->type) 的含义
  4. C语言必知必会-strtok赞歌
  5. HDU 4549 M斐波那契数列
  6. HUD4035Maze
  7. 区块链BAAS平台:公共或私人区块链编程以用于各种用途
  8. Qt随笔 - QSettings
  9. 文件系统的简单的操作
  10. php用jquery-ajax上传多张图片限制图片大小
  11. 基于单片机智能交通灯控制系统设计外文文献_1000多套机械专业毕业设计免费分享(论文+DWG图纸+外文翻译+文献综述+开题报告+答辩) 友图网...
  12. VBA:一个Word VBA编程的例子
  13. 去伪、存真、打破、重塑……网贷业暴雷潮之下的敬畏与回归
  14. 网站 内容更新 监控 php,网站状态监控方法,使用PHP轻松监控你的网站运行状态...
  15. 2021牛客多校#10 F-Train Wreck(数学,优先队列)
  16. Cocos2d-x学习笔记(五)仿真树叶飘落效果的实现(精灵旋转、翻转、钟摆运动等综合运用)
  17. 普加.大学生广告创意大赛公告
  18. 使用优盘为龙芯电脑安装系统
  19. 一个创业小公司老板的管理经验
  20. 微软自带输入法输入时英文的间距突然变大

热门文章

  1. 基于matlab的航迹发生器模拟,仿真输出经纬度、高度、俯仰、航向角等
  2. 达梦导出导入_yxy
  3. 测试用例管理工具SynapseRT(jira插件)的具体使用(一)
  4. 校企合作 | 璞华×中南财经政法大学,共建教学实习(就业实践)基地
  5. 具有有限 TPM 支持的戴尔计算机型号
  6. 第五届北大青鸟杯全国IT精英挑战赛华中区一等奖项目——中商百货分销系统_关键代码说明书
  7. 《逆向管理——先行动后思考》读书笔记
  8. 官方发布历年考研平均分!你今年考多少分才能上岸
  9. html文档本质是一个什么文件,html是什么文件
  10. oracle ebs版本查看,怎么查看oracle ebs的系统版本号以及各模块的版本号 | 码农网...