Hive的数据导入:

  1.从本地文件系统中导入数据到Hive表

    基础语法1 :

      create table 表名(列名1 数据类型, 列名2 数据类型, … …) row format delimited fields terminated by '分隔符' stored as textfile

    参数解释:

      row format delimited --设置创建的表在加载数据的时候,支持的列分隔符

      fields terminated by '分隔符' --指明具体的分隔符

      stored as '数据类型' --设置加载数据的类型,默认textfile(纯文本)

    基础语法 2:

      load data local inpath '本地文件完整路径' into table 表名

    代码示例:

      create table hospital(hospitalid string, hcount double, hallcost double, hreimbursecost double, hcure double, hday double, hrecovery double, ocount double,     ohallcost double, ohreimbursecost double, ocure double, ohrecovery double) row format delimited fields terminated by '\t' stored as textfile;

      load data local inpath '/home/hadoop/part-r-00000' into table hospital;

  2.从HDFS中导入数据到Hive表

    基础语法:

      建表语句同上

      load data inpath 'hdfs文件完整路径' into table 表名

    代码示例:

      load data inpath '/guide/hospitaloutput/part-r-00000' into table hospital;

  3.从别的表中查询出相应的数据并导入到Hive表中

    基础语法:

      建表语句同上

      insert into table 目标表名 select * from 源表名;  //不覆盖数据

      insert overwrite table 目标表名 select * from 源表名;  //覆盖数据

  4.在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中

    基础语法:

      create table 新表名 as select * from 旧表名

      新建表的结构和数据都和源表一致

  5.导入数据到带有分区的表

    基础语法:

      建表语句同上

      alter table 表名 add partition(分区1='值1',分区2='值2',... ...); //添加具体分区(子文件夹)

      load data local inpath '本地文件路径' into table 表名 partition(分区1='值1',分区2='值2',… …);

    注意事项:

      分区文件夹需要在使用前创建

      分区也是列名

      分区2是分区1的子文件夹,以此类推

      导入数据时,并不按照具体的值筛选

  6.导入数据到带有桶的表

    注意事项: 需要设置环境变量:set hive.enforce.bucketing=true;

    示例代码:

      create table hospitalcopy5(hospitalid string, hcount double, hallcost double, hreimbursecost double, hcure double, hday double, hrecovery double, ocount double,     ohallcost double, ohreimbursecost double, ocure double, ohrecovery double) clustered by(hospitalid) into 2 buckets row format delimited fields terminated by '\t' stored     as textfile;

      insert overwrite table hospitalcopy6 select * from hospital;

转载于:https://www.cnblogs.com/qinshifu/p/9032294.html

hive工作记录-20180513相关推荐

  1. 如何通过路由器日志查看路由器是否断网过_路由器本身有一个日志功能,里面存了很多工作记录...

    第一种原因或许是来自路由器内存的问题,路由器本身有一个日志功能,里面存了很多工作记录. 有的路由器本身内存小,用的时间久了日志信息就会占满内存,出现路由器无缘无故卡一下的状况,从而导致网络连接故障,无 ...

  2. 5.20——工作记录

    5.20--工作记录 前言 记录 jsp显示问题 人员详情检索 证件类型 证件号码 变灰 禁用 恢复人员检索信息 总结 前言 记录 jsp显示问题 问题:之前显示成aseid了 问题解决 点详情把人员 ...

  3. 2015年1月工作记录和阅读记录

    2019独角兽企业重金招聘Python工程师标准>>> 关于IT.翻过了2014的一年,也走到了大四的中间.成长说不上,但是眼界是慢慢开阔了.这一年的节奏像流水一样缓慢平稳,没有特别 ...

  4. 5.26——工作记录

    5.26--工作记录 前言 过程 总结 重点 前言 目标:1.准备查询的基础sql 2.查询页面, 3.点击设备编码按钮的显示 4.图片 过程 deviceStatusPerceptionEventI ...

  5. 5.6-5.8工作记录2—分页模糊查询

    5.6-5.8工作记录2-改造ssh 前言 作战过程 5.7项目上篇--分页模糊查询 jsp ssm PK ssh 准备ssm 对比ssh: 工作bug记录 注意 打怪 查询以及分页 知识点 准备第二 ...

  6. 项目实训工作记录(二)

    项目实训工作记录(二)赵乐乐 201800301115 词向量搜索分析与算法设计 项目实训工作记录(二)赵乐乐 201800301115 1.词向量搜索 2.搜索过程中的问题分析 3.基于效率的算法设 ...

  7. openshift/origin工作记录(9)——openshift结合jenkins实现持续集成

    最近工作为基于jenkins.Openshift实现持续集成. 由于只给了我一周的时间,这里先记录一下V1.0版的实现过程. 集成jenkins 参考<openshift/origin学习记录( ...

  8. 2020.4.23工作记录————Regsvr32加载控件失败:“请确保该二进制存储在指定路径中。。。”

    工作记录----Regsvr32加载控件失败: 之前的OCX控件今天我因为工作需要又重新写了个新的,跟之前不同的是这次的控件链接了第三方的动态库,但是在OCX控件生成完成后我使用管理员身份运行cmd对 ...

  9. 计算机科学与技术指导情况记录表,计算机科学与技术学院工作记录模板.doc

    计算机科学与技术学院工作记录模板 武汉科技大学 计算机科学与技术学院 2011 / 2012 学年 第 二 学期 毕业设计工作记录 毕业设计(论文)题目: 基于JAVA的网上购物系统 专业名称: 计算 ...

最新文章

  1. 2020年Q1微信公众号文章列表
  2. IndexedDB 索引数据库
  3. java IO 解析
  4. 【迫零准则】基于迫零准则的自适应线性均衡器的MATLAB仿真
  5. 串行、并行、并发总结
  6. 20条Linux命令面试问答
  7. DP专辑之最长公共子序列及其变形
  8. office工作日志文件_风暴事件处理器–每个工作者的GC日志文件
  9. 联合光伏回应“天价收购”质疑:并非每瓦10.24元
  10. python中文聊天机器人_[源码和文档分享]基于python的中文聊天机器人
  11. 单表mysql分页查询语句怎么写_MySQL单表百万数据记录分页性能优化技巧
  12. linux 使用yum给已安装的软件降级
  13. 经典创意slogan大全
  14. TortoiseSVN简明教程
  15. Nacos+Gateway503错误,No servers available for service
  16. html中图像标记的属性,HTML中的图象标签属性
  17. 搭建dubbo监控中心
  18. python SM2明文密码加解密
  19. Typecho 免费仿书本的“简单书本“模板
  20. C++智能指针unique_ptr与shared_ptr

热门文章

  1. C++智能指针简单剖析
  2. git上传文件到github
  3. linux源码安装nginx
  4. HTML5区域范围文本框实例页面
  5. java.util.Queue用法
  6. 为什么有这个提示“Escape character is '^]'.”?(转载)
  7. MATLAB-Direct access of structure fields returned by a function call is not allowed 的解决方法~
  8. 实验管理系统java,大学生创新实验室信息管理系统 java+mysql
  9. java怎么遍历优先级队列_打印优先级队列的内容[java]
  10. js 判断支持webgl_基于WebGL无插件虚拟场景漫游技术如何构建?ThingJS