CREATE EXTERNAL

TABLE IF NOT EXISTS data_zh(

ROWKEY STRING,

STATION INT,

YEAR INT,

MONTH INT,

DAY INT,

HOUR INT,

MINUTE INT,

)

PARTITIONED BY (AGE INT)

指定分区(此列并没真正存储列,也就是不存于你的数据中。但是如果你的数据从Oracle按年份导出,按照年份分区,把每一年数据放到age对应的目录下)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ‘,’

字段分隔符

LINES TERMINATED BY ‘\n’ 行分隔符

STORED AS TEXTFILE; 作为文本存储

Hive加载数据到表中

加载数据

LOAD DATA INPATH

‘/data/’ OVERWRITE INTO TABLE data_zh;

#加载某个目录下所有数据,存在分区数据不能这样加载

分区加载数据

创建分区

ALTER TABLE data_zhp ADD PARTITION(AGE= 1998)

加载数据

LOAD DATA INPATH ‘/data/1998.txt’ INTO TABLE data_zhp

PARTITION(YEAR=1998);

指定分区目录

LOCATION ‘

/hiveuser/hive/warehouse/data_zh.db/data_zh/2012.txt’;(指定分区所在位置)

加载数据到指定分区,分区表加载方法

下面为将现有表,修改为分区表。注意创建分区的时候未指定分区表,不能创建分区。需要新建表哥,用动态分区导入数据,动态分区数量有限。参考Programming

Hive记得最大上限应该是10000

Hive修改现有表添加分区

添加分区

ALTER TABLE data_zh ADD IF NOT EXISTS

PARTITION (year = 1998) LOCATION

‘/hiveuser/hive/warehouse/data_zh.db/data_zh/1998.txt’

删除分区

ALTER TABLE data_zhp DROP IF EXISTS PARTITION(year =1998);

修改现有表添加分区

创建分区表

CREATE EXTERNAL TABLE IF NOT EXISTS data_zhp(

ROWKEY STRING,

STATION INT,

MONTH INT,

DAY INT,

HOUR INT,

MINUTE INT,

)

PARTITIONED BY (YEAR INT)

ROW FORMAT DELIMITED

FIELDS TERMINATED BY ‘,’

LINES TERMINATED BY ‘\n’

STORED AS TEXTFILE;

动态分区指令

set

hive.exec.dynamic.partition=true;

set hive.exec.dynamic.partition.mode=nonstrict;

#set hive.enforce.bucketing = true;

未分区表数据导入分区表

insert overwrite table data_zhp partition (YEAR,MONTH) select *

from data_zh;

hive创建分区表 指定分隔符_HIVE 对于分区表的操作相关推荐

  1. hive创建分区表 指定分隔符_hive建表语句行分隔符

    如何生成hive的建表语句 hivesql sql - 获取指定hive表或指定文件中所有hive表的DDL,如果有按天的分区则默认执行最近7天的分区DDL.同时,table支持符合sql语法的正则表 ...

  2. hive 字符串替换指定字符_hive学习笔记:substr()——字符串截取

    在hive中,可以使用substr()函数截取字符串,比如从日期中截取年份.月份等信息. 还有一个函数是substring(),用法基本上与substr()相同,至于区别这里暂时不做研究. subst ...

  3. hive分隔符_Hive踩过的坑-hive多个分隔符的问题

    今天就说说hive多个分隔符的问题. 多分隔符(列)这个问题,也是之前同事给我一份文件我才发现的... 这份文件上列分隔符是@#| hive建表时,ROW FORMAT DELIMITED FIELD ...

  4. 【原】创建Hive表,分号分隔符“;”引起的异常

    [原]创建Hive表,分号分隔符":"引起的异常 参考文章: (1)[原]创建Hive表,分号分隔符":"引起的异常 (2)https://www.cnblog ...

  5. SQL Server 2005中的分区表(一):什么是分区表?为什么要用分区表?如何创建分区表?

    如果你的数据库中某一个表中的数据满足以下几个条件,那么你就要考虑创建分区表了. 1.数据库中某个表中的数据很多.很多是什么概念?一万条?两万条?还是十万条.一百万条?这个,我觉得是仁者见仁.智者见智的 ...

  6. Hive建表时指定分隔符或使用多字符分隔

    不知道你是否会有会这样的苦恼,就是从hdfs或者file中导入数据到Hive建数仓的时候,因为数据是数据流前段的小GG用特殊符号分隔的,然后导致你导入数据时一脸蒙圈? 这篇教程可能会帮到你. 首先我们 ...

  7. pyspark —— spark dataframe 从hdfs读写文件:按照指定文件格式读写文件(读写csv、json、text文件,读取hive表,读取MySQL表)、按照指定分隔符读写文件

    spark有3种数据结构--RDD.DataFrame.DataSet.这里展示的文件读写方式,都是针对dataFrame数据结构的,也就是文件读进来之后,是一个spark dataFrame. 0. ...

  8. hive 按照指定分隔符取最后一个下标

    hive 按照指定分隔符取最后一个下标 split思路 select reverse(split(reverse('其他,沟通中'),',')[1]) 该方法可以实现,但是对于中文有bug,二次反转会 ...

  9. Hadoop HIVE 创建表

    创建库 库名 目录 描述 default hdfs://hdp20-01:9000/user/hive/warehouse 默认数据库 create database db_test; hdfs:// ...

最新文章

  1. 【Round #36 (Div. 2 only) B】Safe Spots
  2. 析构函数virtual与非virtual区别
  3. 《C语言程序设计》王希杰 课后答案
  4. c++中static的全部用法
  5. WSS 3.0部署备忘 六
  6. 和菜鸟一起学linux之V4L2摄像头应用流程【转】
  7. [Python] 当猎头遇上 Guido van Rossum
  8. C#:数据库操作(待补充)
  9. 孙鑫VC学习笔记:第十一讲 (六) 图形重绘方法二 利用元文件
  10. matlab-画折线图
  11. graphpad如何换柱状图与折线图能否混合一起_excel柱状图加折线图组合怎么做,原来是这样的...
  12. Unix/Linux环境C编程入门教程(14) Mandriva LinuxCCPP开发环境搭建
  13. 【路径规划】基于蚁群求解多旅行商MTSP问题matlab源码
  14. mixamo进不去_酷站推荐!3D人物动画工具
  15. DVWA 不跳转_20201020好软件不私藏:稀有极品神器,直接解锁VIP!!
  16. 淘宝API-item_search - 按关键字搜索淘宝商品
  17. 整理了300个市面上最不常见的springboot计算机毕业设计选题。满满的干货
  18. Airpods连接到windows10没有声音(其他办法都试过最后这样才行)
  19. 身份证号码含义及最后一位校验算法(ISO 7064:1983.MOD 11-2)
  20. Qt编写可视化大屏电子看板系统5-恢复布局

热门文章

  1. 第13章 程序的动态加载和执行(一,引导)
  2. 【Mail】telnet收发邮件过程
  3. html文本框样式大全,HTML文本框样式大全
  4. mysql运营_为线上运营Mysql数据库设置从库
  5. 【OS学习笔记】十 实模式:实现一个程序加载器-程序加载器如何将用户程序加载到内存并执行
  6. 推荐几个.NET开源图表组件 [转]
  7. c# winform窗体如何设置才可以不能随意拖动大小
  8. JQuery中的Deferred-详解和使用
  9. php 把一个数组分成有n个元素的二维数组的算法
  10. Python学习札记(十七) 高级特性3 列表生成式