有个需求,需要在hive表里面追加数据,数据是历史数据,是业务方给的一个csv文件,

思路,考虑使用load data inpath,把历史数据导入到hive表里面

步骤:

1、利用已经搭建好的大数据平台,把csv文件上传到HDFS, 我是直接利用大数据平台提供的页面上传功能,
如果没有这个条件的,可以使用命令行:hadoop fs -put xxx.csv /export, 指定一个目录,目录名为export

2、创建一个表,表里面的字段名称和字段顺序,跟csv文件保持一致,例如这个表名叫 infor.load_data_test;

3、load data inpath 'hdfs://xxxxxx/user/hive/warehouse/export/xxx.csv' overwrite into table infor.load_data_test;
其中'hdfs://xxxxxx/user/hive/warehouse/export/xxx.csv',是文件上传后,存放的位置

4、把临时表的数据写入到正式的hive表中

INSERT into infor.formal_data_table
select field1,field2, 1597456800000 as create_time from infor.load_data_test;

加一个时间戳,标识这批数据是什么时候写入的

load data inpath的实践相关推荐

  1. hive load data inpath 空目录_走近大数据之Hive进阶(一、Hive数据的导入)

    一.使用Load语句进行数据的导入 -语法: LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE]INTO TABLE tablename [PARTITIO ...

  2. hive load data inpath ‘‘ overwrite into 坑

    load data inpath 'dataDir/dim_url.csv' overwrite into table dim_url partition(day='2021-03') 注意: 1,以 ...

  3. hive load data inpath 空目录_hive学习笔记之四:分区表

    欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类和汇总,及配套源码,涉及Java.Docker.Kubernetes.DevO ...

  4. hive load data inpath 空目录_Hive内部表 | 每日五分钟学大数据

    上一篇说的是外部表,当把EXTERNAL关键字去掉的时候就是内部表了.为什么叫内部表,因为这种表,Hive会(或多或少地)控制着数据的生命周期. 如果你熟悉Hive那你一定知道,Hive默认情况下会将 ...

  5. Hive - Load Data 数据过长或过短

    一.引言 Hive 可以通过 load data inpath 加载本地或者 hdfs 的数据到 hive 表中,有时会出现生成数据长于 hive 表字段或者短于 hive 表字段的情况,经过测试,两 ...

  6. hive load data外部表报错_从0开始学大数据-Hive基础篇

    Hive起源于Facebook,是基于 Hadoop HDFS 分布式文件系统的分布式 数据仓库 架构.它为数据仓库的管理提供了许多功能:数据ETL(抽取.转换和加载)工具.数据存储管理和大型数据集的 ...

  7. hive load data出错

    今天往hive导数据时发生了个错误 hive> load data inpath '/user/tmp/uids.test_copy_3.txt' into table userfeature. ...

  8. Error: Error while compiling statement: FAILED: SemanticException Unable to load data to destination

    ods层新加了一张表,和以前的格式一样 DROP TABLE IF EXISTS ods_students_industry_level; CREATE TABLE `ods_students_ind ...

  9. Hive Create Table和Load DATA详解

    Hive Create Table和Load DATA详解 一.Hive Create Table详细讲解 二.LOAD DATA 测试使用 三.内部表和外部表区别 Hive在使用创建表的时候,有有一 ...

最新文章

  1. if(window.event) e = window.event
  2. 学校计算机培训管理制度,小学教师信息技术培训管理制度
  3. 最近...(2019-03-18~2019-04-03)
  4. 自定义一个SharedPreferences工具类
  5. Flink SQL Client注册JAVA UDF完整流程
  6. java 线程安全性_我如何测试Java类的线程安全性
  7. 去除vue项目中的#及其ie9兼容性
  8. LeetCode MySQL 1853. 转换日期格式(日期格式化)
  9. php echo 大括号,PHP中echo输出中存在括号()的处理
  10. android9 添加开机音乐
  11. GD32实战16__备份域
  12. zabbix3.4详细安装教程
  13. android9彩蛋小米触发不了,小米9成功运行基于Android Q的MIUI系统:初版BUG较多
  14. !$boo在php中什么意思,php前戏
  15. iOS图片占内存过大的问题完美解决
  16. 本科,硕士们进了BAT拿高工资,为什么博士却要挤破头低薪进985高校?
  17. 教你学Java | 带你学习Java多线程(续:创建线程的其他方式与activeCount方法的浅谈)
  18. 机器学习编译MLC 笔记 1-5章(上)
  19. ios第三方数据请求 UI_15
  20. 未启用windows无线服务器,win10未启用对服务器的远程

热门文章

  1. kde 桌面显示管理器_KDE文件管理器Dolphin的综合指南
  2. ug html文件是什么,ug未保存以下对象
  3. 详解Citrix思杰XenServer虚拟化
  4. 王桂林讲C++之指向类成员指针
  5. Spark sql之开窗函数
  6. C语言两班平均成绩,《统计学原理》复习参考(完整答案)
  7. golang爬虫项目Pholcus源码分析(四)
  8. ios harmonyos,MIUI 13,IOS 15,鸿蒙OS系统 六月份齐上线,一文了解都有哪些升级与亮点...
  9. 基于C++的Mips模拟器设计
  10. BUUCTF 每日打卡 2021-4-28