五, Hive-数据的导入和导出

5.1 数据导入

法1, 向表中装载数据(load)

[案例实操]

  1. 创建表

  2. 加载本地文件到此表中

  3. 加载HDFS文件到此表中不进行覆盖

执行load之后, HDFS的inpat路径中就不再含有这个数据文件, 因为这个文件被移动到hdfs中存储hive数据的目录中(在hdfs中默认路径为 /user/hive/warehouse/表名)去了.

  1. 加载HDFS文件到此表中进行覆盖

法2, 通过查询语句向表中插入数据(insert)

法3, 通过查询表来新建表(As select 语句)

法3, 创建表时通过 Location指定加载数据路径(通常这个表是外部表)

  1. 准备文件
  2. 通过 Location指定加载数据路径

法4, 从HDFS文件中Import(导入)数据到指定 Hive表中

前置条件: 先Export 导出

5.2 数据导出

法1, Insert 导出

法2, Hadoop命令导出到本地(hdfs 的下载)

法3, Hive shell命令 导出

注意: 图中小错误, 一个>是覆盖. 两个>>是追加

法4, Export 导出到HDFS上

  1. export table xx to ‘path’


  1. import table xx from ‘path’

千万要注意. import到的表要求: 要么不存在, 要么不包含数据(空表)

  • 新表

  • 已存在的空表

法5, Sqoop导出(以后学)

法6, 清除表中数据(Truncate)

Truncate只能清除管理表对应HDFS上的数据(内部表还在),无法清除外部表(会报错).
, 清除表中数据(Truncate)

Truncate只能清除管理表对应HDFS上的数据(内部表还在),无法清除外部表(会报错).
drop命令只能删除表, 无法删除HDFS上的数据.

五, Hive-数据的导入和导出相关推荐

  1. Hadoop之Hive数据的导入与导出(DML)

    上一张章节我们已经讲完了数据库和表的增删改查,感兴趣的小伙伴可以点这里: Hadoop之Hive数据库和表的增删改查(DDL). 本章节将要学习对数据操作的DML,主要包括数据的导入和导出,清除. 目 ...

  2. Hive中数据的导入与导出

    最近在做一个小任务,将一个CDH平台中Hive的部分数据同步到另一个平台中.毕竟我也刚开始工作,在正式开始做之前,首先进行了一段时间的练习,下面的内容就是练习时写的文档中的内容.如果哪里有错误或者疏漏 ...

  3. R 数据的导入和导出

    2019独角兽企业重金招聘Python工程师标准>>> R 数据的导入和导出 这是从R中导入或导出数据的一个指导手册. 本文档的当前版本为0.01 β.该文档译自 R-2.6.1 文 ...

  4. matlab将图片导入工作区,matlab数据的导入和导出,以matlab工作区workspace为source和destination...

    MATLAB支持工作区的保存.用户可以将工作区或工作区中的变量以文件的形式保存,以备在需要时再次导入. 保存工作区可以通过菜单进行,也可以通过命令窗口进行. 数据导出 1. 保存整个工作区 选择Fil ...

  5. SqlServer2012语句之实例之用SQL语句对表中数据进行操作及数据的导入和导出

    --5月7日   SQL Server实验内容 --一.用SQL语句对表中数据进行操作 --1.根据系部表.班级表.学生表.教师表已有数据(如果没有数据,请使用管理平台或者SQL语句先为以上表添加数据 ...

  6. 基于Metronic的Bootstrap开发框架经验总结(7)--数据的导入、导出及附件的查看处理...

    在很多系统模块里面,我们可能都需要进行一定的数据交换处理,也就是数据的导入或者导出操作,这样的批量处理能给系统用户更好的操作体验,也提高了用户录入数据的效率.我在较早时期的EasyUI的Web框架上, ...

  7. MySQL基础day03_数据的导入、导出-MySQL 5.6

    MySQL基础day03_数据的导入.导出-MySQL 5.6 注:把数据按照一定格式存放到文件里才能进行数据的导入. 1,数据导入的条件 把文件里的内容保存到数据的表里: 把数据按照一定格式存放文件 ...

  8. (转)基于Metronic的Bootstrap开发框架经验总结(7)--数据的导入、导出及附件的查看处理...

    http://www.cnblogs.com/wuhuacong/p/4777720.html 在很多系统模块里面,我们可能都需要进行一定的数据交换处理,也就是数据的导入或者导出操作,这样的批量处理能 ...

  9. oracle导入失败后怎样删除已导入数据,Oracle数据的导入、导出、插入、更新及删除总结...

    Oracle数据的导入.导出.插入.更新及删除总结 今天主要介绍一下使用Oracle的IDE:PL\SQL Developer进行数据的导入及导出操做方法. web 1. 数据导出 数据的导出比较简单 ...

最新文章

  1. iOS超全开源框架、项目和学习资料汇总:UI篇
  2. java只会用不知道原理6_程序员面试宝典之14道初级Java面试题分享
  3. android aar编程,AndroidStudio脚本命令指定AAR生成目录与版本号
  4. 南邮攻防训练平台逆向maze
  5. 深入理解js系列一作用域是什么
  6. IOS 中runtime 不可变数组__NSArray0 和__NSArrayI
  7. 雪豹玩家必备网站推荐:
  8. 苹果iPad Pro将转向OLED屏幕 首款明年下半年推出
  9. [BZOJ] 1614: [Usaco2007 Jan]Telephone Lines架设电话线
  10. 如何在Windows即服务上安装Memcached Server
  11. matlab高斯滤波器
  12. Unity3d Google Play内购尝试客户端坑记
  13. 扫地机器人石头爬坡_用了就再也离不开的懒人神器,石头扫地机器人P5初体验...
  14. 编写一个shell脚本,使其能够备份/etc目录下所有文件,并且备份的文件名需要自动生成日期,即产生后缀名形如.backup_20210624的文件。
  15. 回归(Regression )
  16. 知识图谱数据集下载 KnowledgeGraphDatasets
  17. android通过百度语音合成实现文字转换成语音(TTS)详细教程?
  18. 什么时候测试人员应该考虑重复的缺陷?
  19. Obsidian:实现日记记录【设计并使用模板】
  20. war包方式部署solo博客

热门文章

  1. Http Live Streaming介绍和应用
  2. IT运维人员,该如何规划自己的职业路?
  3. windows/linux 系统U盘制作系统盘(实战,简单)
  4. 基于 HTML5 WebGL 的 CPU 仿真 3D 可视化
  5. 新经济专家陈宗建:山东将是全球新经济主战场山东新旧动能转换专访报道
  6. JAVA中设置drwxr_x___权限_linux命令中chmod 777 以及drwxr-xr-x分别代表什么意思
  7. 一定要独立,一定要争气
  8. 借鉴-牛人开发的网络搜索工具
  9. PTC贴片保险的测试
  10. hadoop jar xxxx.jar 执行的流程