五, Hive-数据的导入和导出
五, Hive-数据的导入和导出
5.1 数据导入
法1, 向表中装载数据(load)
[案例实操]
创建表
加载本地文件到此表中
加载HDFS文件到此表中不进行覆盖
执行load之后, HDFS的inpat路径中就不再含有这个数据文件, 因为这个文件被移动到hdfs中存储hive数据的目录中(在hdfs中默认路径为 /user/hive/warehouse/表名)去了.
- 加载HDFS文件到此表中进行覆盖
法2, 通过查询语句向表中插入数据(insert)
法3, 通过查询表来新建表(As select 语句)
法3, 创建表时通过 Location指定加载数据路径(通常这个表是外部表)
- 准备文件
- 通过 Location指定加载数据路径
法4, 从HDFS文件中Import(导入)数据到指定 Hive表中
前置条件: 先Export 导出
5.2 数据导出
法1, Insert 导出
法2, Hadoop命令导出到本地(hdfs 的下载)
法3, Hive shell命令 导出
注意: 图中小错误, 一个
>
是覆盖. 两个>>
是追加
法4, Export 导出到HDFS上
- export table xx to ‘path’
- import table xx from ‘path’
千万要注意. import到的表要求: 要么不存在, 要么不包含数据(空表)
新表
已存在的空表
法5, Sqoop导出(以后学)
法6, 清除表中数据(Truncate)
Truncate只能清除管理表对应HDFS上的数据(内部表还在),无法清除外部表(会报错).
, 清除表中数据(Truncate)
Truncate只能清除管理表对应HDFS上的数据(内部表还在),无法清除外部表(会报错).
drop命令只能删除表, 无法删除HDFS上的数据.
五, Hive-数据的导入和导出相关推荐
- Hadoop之Hive数据的导入与导出(DML)
上一张章节我们已经讲完了数据库和表的增删改查,感兴趣的小伙伴可以点这里: Hadoop之Hive数据库和表的增删改查(DDL). 本章节将要学习对数据操作的DML,主要包括数据的导入和导出,清除. 目 ...
- Hive中数据的导入与导出
最近在做一个小任务,将一个CDH平台中Hive的部分数据同步到另一个平台中.毕竟我也刚开始工作,在正式开始做之前,首先进行了一段时间的练习,下面的内容就是练习时写的文档中的内容.如果哪里有错误或者疏漏 ...
- R 数据的导入和导出
2019独角兽企业重金招聘Python工程师标准>>> R 数据的导入和导出 这是从R中导入或导出数据的一个指导手册. 本文档的当前版本为0.01 β.该文档译自 R-2.6.1 文 ...
- matlab将图片导入工作区,matlab数据的导入和导出,以matlab工作区workspace为source和destination...
MATLAB支持工作区的保存.用户可以将工作区或工作区中的变量以文件的形式保存,以备在需要时再次导入. 保存工作区可以通过菜单进行,也可以通过命令窗口进行. 数据导出 1. 保存整个工作区 选择Fil ...
- SqlServer2012语句之实例之用SQL语句对表中数据进行操作及数据的导入和导出
--5月7日 SQL Server实验内容 --一.用SQL语句对表中数据进行操作 --1.根据系部表.班级表.学生表.教师表已有数据(如果没有数据,请使用管理平台或者SQL语句先为以上表添加数据 ...
- 基于Metronic的Bootstrap开发框架经验总结(7)--数据的导入、导出及附件的查看处理...
在很多系统模块里面,我们可能都需要进行一定的数据交换处理,也就是数据的导入或者导出操作,这样的批量处理能给系统用户更好的操作体验,也提高了用户录入数据的效率.我在较早时期的EasyUI的Web框架上, ...
- MySQL基础day03_数据的导入、导出-MySQL 5.6
MySQL基础day03_数据的导入.导出-MySQL 5.6 注:把数据按照一定格式存放到文件里才能进行数据的导入. 1,数据导入的条件 把文件里的内容保存到数据的表里: 把数据按照一定格式存放文件 ...
- (转)基于Metronic的Bootstrap开发框架经验总结(7)--数据的导入、导出及附件的查看处理...
http://www.cnblogs.com/wuhuacong/p/4777720.html 在很多系统模块里面,我们可能都需要进行一定的数据交换处理,也就是数据的导入或者导出操作,这样的批量处理能 ...
- oracle导入失败后怎样删除已导入数据,Oracle数据的导入、导出、插入、更新及删除总结...
Oracle数据的导入.导出.插入.更新及删除总结 今天主要介绍一下使用Oracle的IDE:PL\SQL Developer进行数据的导入及导出操做方法. web 1. 数据导出 数据的导出比较简单 ...
最新文章
- iOS超全开源框架、项目和学习资料汇总:UI篇
- java只会用不知道原理6_程序员面试宝典之14道初级Java面试题分享
- android aar编程,AndroidStudio脚本命令指定AAR生成目录与版本号
- 南邮攻防训练平台逆向maze
- 深入理解js系列一作用域是什么
- IOS 中runtime 不可变数组__NSArray0 和__NSArrayI
- 雪豹玩家必备网站推荐:
- 苹果iPad Pro将转向OLED屏幕 首款明年下半年推出
- [BZOJ] 1614: [Usaco2007 Jan]Telephone Lines架设电话线
- 如何在Windows即服务上安装Memcached Server
- matlab高斯滤波器
- Unity3d Google Play内购尝试客户端坑记
- 扫地机器人石头爬坡_用了就再也离不开的懒人神器,石头扫地机器人P5初体验...
- 编写一个shell脚本,使其能够备份/etc目录下所有文件,并且备份的文件名需要自动生成日期,即产生后缀名形如.backup_20210624的文件。
- 回归(Regression )
- 知识图谱数据集下载 KnowledgeGraphDatasets
- android通过百度语音合成实现文字转换成语音(TTS)详细教程?
- 什么时候测试人员应该考虑重复的缺陷?
- Obsidian:实现日记记录【设计并使用模板】
- war包方式部署solo博客
热门文章
- Http Live Streaming介绍和应用
- IT运维人员,该如何规划自己的职业路?
- windows/linux 系统U盘制作系统盘(实战,简单)
- 基于 HTML5 WebGL 的 CPU 仿真 3D 可视化
- 新经济专家陈宗建:山东将是全球新经济主战场山东新旧动能转换专访报道
- JAVA中设置drwxr_x___权限_linux命令中chmod 777 以及drwxr-xr-x分别代表什么意思
- 一定要独立,一定要争气
- 借鉴-牛人开发的网络搜索工具
- PTC贴片保险的测试
- hadoop jar xxxx.jar 执行的流程