hive创建分区表 指定分隔符_HIVE 对于分区表的操作
CREATE EXTERNAL
TABLE IF NOT EXISTS data_zh(
ROWKEY STRING,
STATION INT,
YEAR INT,
MONTH INT,
DAY INT,
HOUR INT,
MINUTE INT,
)
PARTITIONED BY (AGE INT)
指定分区(此列并没真正存储列,也就是不存于你的数据中。但是如果你的数据从Oracle按年份导出,按照年份分区,把每一年数据放到age对应的目录下)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
字段分隔符
LINES TERMINATED BY ‘\n’ 行分隔符
STORED AS TEXTFILE; 作为文本存储
Hive加载数据到表中
加载数据
LOAD DATA INPATH
‘/data/’ OVERWRITE INTO TABLE data_zh;
#加载某个目录下所有数据,存在分区数据不能这样加载
分区加载数据
创建分区
ALTER TABLE data_zhp ADD PARTITION(AGE= 1998)
加载数据
LOAD DATA INPATH ‘/data/1998.txt’ INTO TABLE data_zhp
PARTITION(YEAR=1998);
指定分区目录
LOCATION ‘
/hiveuser/hive/warehouse/data_zh.db/data_zh/2012.txt’;(指定分区所在位置)
加载数据到指定分区,分区表加载方法
下面为将现有表,修改为分区表。注意创建分区的时候未指定分区表,不能创建分区。需要新建表哥,用动态分区导入数据,动态分区数量有限。参考Programming
Hive记得最大上限应该是10000
Hive修改现有表添加分区
添加分区
ALTER TABLE data_zh ADD IF NOT EXISTS
PARTITION (year = 1998) LOCATION
‘/hiveuser/hive/warehouse/data_zh.db/data_zh/1998.txt’
删除分区
ALTER TABLE data_zhp DROP IF EXISTS PARTITION(year =1998);
修改现有表添加分区
创建分区表
CREATE EXTERNAL TABLE IF NOT EXISTS data_zhp(
ROWKEY STRING,
STATION INT,
MONTH INT,
DAY INT,
HOUR INT,
MINUTE INT,
)
PARTITIONED BY (YEAR INT)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ‘,’
LINES TERMINATED BY ‘\n’
STORED AS TEXTFILE;
动态分区指令
set
hive.exec.dynamic.partition=true;
set hive.exec.dynamic.partition.mode=nonstrict;
#set hive.enforce.bucketing = true;
未分区表数据导入分区表
insert overwrite table data_zhp partition (YEAR,MONTH) select *
from data_zh;
hive创建分区表 指定分隔符_HIVE 对于分区表的操作相关推荐
- hive创建分区表 指定分隔符_hive建表语句行分隔符
如何生成hive的建表语句 hivesql sql - 获取指定hive表或指定文件中所有hive表的DDL,如果有按天的分区则默认执行最近7天的分区DDL.同时,table支持符合sql语法的正则表 ...
- hive 字符串替换指定字符_hive学习笔记:substr()——字符串截取
在hive中,可以使用substr()函数截取字符串,比如从日期中截取年份.月份等信息. 还有一个函数是substring(),用法基本上与substr()相同,至于区别这里暂时不做研究. subst ...
- hive分隔符_Hive踩过的坑-hive多个分隔符的问题
今天就说说hive多个分隔符的问题. 多分隔符(列)这个问题,也是之前同事给我一份文件我才发现的... 这份文件上列分隔符是@#| hive建表时,ROW FORMAT DELIMITED FIELD ...
- 【原】创建Hive表,分号分隔符“;”引起的异常
[原]创建Hive表,分号分隔符":"引起的异常 参考文章: (1)[原]创建Hive表,分号分隔符":"引起的异常 (2)https://www.cnblog ...
- SQL Server 2005中的分区表(一):什么是分区表?为什么要用分区表?如何创建分区表?
如果你的数据库中某一个表中的数据满足以下几个条件,那么你就要考虑创建分区表了. 1.数据库中某个表中的数据很多.很多是什么概念?一万条?两万条?还是十万条.一百万条?这个,我觉得是仁者见仁.智者见智的 ...
- Hive建表时指定分隔符或使用多字符分隔
不知道你是否会有会这样的苦恼,就是从hdfs或者file中导入数据到Hive建数仓的时候,因为数据是数据流前段的小GG用特殊符号分隔的,然后导致你导入数据时一脸蒙圈? 这篇教程可能会帮到你. 首先我们 ...
- pyspark —— spark dataframe 从hdfs读写文件:按照指定文件格式读写文件(读写csv、json、text文件,读取hive表,读取MySQL表)、按照指定分隔符读写文件
spark有3种数据结构--RDD.DataFrame.DataSet.这里展示的文件读写方式,都是针对dataFrame数据结构的,也就是文件读进来之后,是一个spark dataFrame. 0. ...
- hive 按照指定分隔符取最后一个下标
hive 按照指定分隔符取最后一个下标 split思路 select reverse(split(reverse('其他,沟通中'),',')[1]) 该方法可以实现,但是对于中文有bug,二次反转会 ...
- Hadoop HIVE 创建表
创建库 库名 目录 描述 default hdfs://hdp20-01:9000/user/hive/warehouse 默认数据库 create database db_test; hdfs:// ...
最新文章
- 【Round #36 (Div. 2 only) B】Safe Spots
- 析构函数virtual与非virtual区别
- 《C语言程序设计》王希杰 课后答案
- c++中static的全部用法
- WSS 3.0部署备忘 六
- 和菜鸟一起学linux之V4L2摄像头应用流程【转】
- [Python] 当猎头遇上 Guido van Rossum
- C#:数据库操作(待补充)
- 孙鑫VC学习笔记:第十一讲 (六) 图形重绘方法二 利用元文件
- matlab-画折线图
- graphpad如何换柱状图与折线图能否混合一起_excel柱状图加折线图组合怎么做,原来是这样的...
- Unix/Linux环境C编程入门教程(14) Mandriva LinuxCCPP开发环境搭建
- 【路径规划】基于蚁群求解多旅行商MTSP问题matlab源码
- mixamo进不去_酷站推荐!3D人物动画工具
- DVWA 不跳转_20201020好软件不私藏:稀有极品神器,直接解锁VIP!!
- 淘宝API-item_search - 按关键字搜索淘宝商品
- 整理了300个市面上最不常见的springboot计算机毕业设计选题。满满的干货
- Airpods连接到windows10没有声音(其他办法都试过最后这样才行)
- 身份证号码含义及最后一位校验算法(ISO 7064:1983.MOD 11-2)
- Qt编写可视化大屏电子看板系统5-恢复布局
热门文章
- 第13章 程序的动态加载和执行(一,引导)
- 【Mail】telnet收发邮件过程
- html文本框样式大全,HTML文本框样式大全
- mysql运营_为线上运营Mysql数据库设置从库
- 【OS学习笔记】十 实模式:实现一个程序加载器-程序加载器如何将用户程序加载到内存并执行
- 推荐几个.NET开源图表组件 [转]
- c# winform窗体如何设置才可以不能随意拖动大小
- JQuery中的Deferred-详解和使用
- php 把一个数组分成有n个元素的二维数组的算法
- Python学习札记(十七) 高级特性3 列表生成式