Hive(二)——数据类型与文件格式

数据
  • 基本数据类型

  • 集合数据类型

  • 分隔符

# 数据:
John Doe^A100000.0^AMary Smith^BTodd Jones^AFederal Taxes^C.2^BStateTaxes^C.05^ BInsurance^C.1^A1 Michigan Ave.^BChicago^BIL^B60600{"name": "John Doe","salary": 100000.0,"subordinates": ["Mary Smith", "Todd Jones"],"deductions": {"Federal Taxes":  .2,"State Taxes":   .05,"Insurance":    .1},"address": {"street": "1 Michigan Ave.","city": "Chicago","state": "IL","zip": 60600}
}
# 例:
CREATE TABLE employees (name      STRING,salary      FLOAT,subordinates ARRAY<STRING>,deductions   MAP<STRING, FLOAT>,address   STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>)
ROW FORMAT DELIMITED  # ROW FORMAT DELIMITED这组关键字必须要写在其他子句(除了STORED AS ... 子句)之前
FIELDS TERMINATED BY '\001'
COLLECTION ITEMS TERMINATED BY '\002'
MAP KEYS TERMINATED BY '\003'
LINES TERMINATED BY '\n'  # 子句LINES TERMINATED BY '…'和STORED AS …不需要ROW FORMAT DELIMITED关键字
STORED AS TEXTFILE;  # Hive到目前为止对于LINESTERMINATED BY …仅支持字符‘\n’,也就是说行与行之间的分隔符只能为‘\n’
  • 如果一个表表结构指定三个字段,而数据文件有五列,则后两列会被舍弃

  • 如果某些字段是数值型的,但是Hive在读取时发现存在非数值型的字符串值的话,那么对于那些字段将会返回null值。————读时模式

  • 如果数据库非常多的话,那么可以使用正则表达式匹配来筛选出需要的数据库名

    hive >show databases like 'h.*';
    
  • 建库语句使用LOCATION关键字可指定数据库位置(默认hive.metastore.warehouse.dir)

    hive> CREATE DATABASE financials> LOCATION '/my/preferred/directory';
    
  • 默认情况下,Hive是不允许用户删除一个包含有表的数据库的。用户要么先删除数据库中的表,然后再删除数据库;要么在删除命令的最后面加上关键字CASCADE,这样可以使Hive自行先删除数据库中的表

    hive > DROP DATABASE IF EXISTS finacials CASCADE;
    
  • 用户可以使用ALTER DATABASE命令为某个数据库的DBPROPERTIES设置键-值对属性值,来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的,包括数据库名和数据库所在的目录位置

    hive > ALTER DATABASE financials SET DBPROPERTIES ('edited-by' = 'Joe Dba');
    

Hive(二)——数据类型与文件格式相关推荐

  1. linux hive查询数据类型,04-hive的数据类型

    转载请注明~ 在学习了Linux系统操作命令和shell编程之后,将进入到hive的学习中,先主要介绍hive的数据类型和文件格式. 01数据类型 基本数据类型 Hive 提供了基本数据类型和复杂数据 ...

  2. 谈笑间学会大数据-Hive数据类型和文件格式

    Hive数据类型和文件格式 目录 Hive数据类型和文件格式 Hive数据类型 数据类型的意义 hive基本数据类型 集合数据类型 文本文件数据编码 读时模式 hive存储格式类型 Hive数据类型 ...

  3. 【python opencv 计算机视觉零基础到实战】二、 opencv文件格式与摄像头读取

    一.学习目标 了解图片的结构属性 了解如何捕获视频 了解waitkey的使用方法 目录 [python opencv 计算机视觉零基础到实战] 一.opencv的helloworld [[python ...

  4. bigint hive java类型_三十、Hive的数据类型以及常用的属性配置

    上篇文章我们在服务器上部署了Hive并将它的Metastore存储在了MySQL上,本文介绍一下Hive的数据类型以及常用的一些属性配置.关注专栏<破茧成蝶--大数据篇>,查看更多相关的内 ...

  5. 三十、Hive的数据类型以及常用的属性配置

    上篇文章我们在服务器上部署了Hive并将它的Metastore存储在了MySQL上,本文介绍一下Hive的数据类型以及常用的一些属性配置.关注专栏<破茧成蝶--大数据篇>,查看更多相关的内 ...

  6. C#2.0实例程序STEP BY STEP--实例二:数据类型

    C#2.0实例程序STEP BY STEP--实例二:数据类型 与其他.NET语言一样,C#支持Common Type Sysem(CTS),其中的数据类型集合不仅包含我们熟悉的基本类型,例如int, ...

  7. Hive学习笔记 —— Hive的数据类型

    Hive本质上是一个数据库,可以创建表,表有列组成,而列支持的主要类型有:基本数据类型.复杂数据类型.时间数据类型. 1. Hive的数据类型之基本数据类型 tinyint/smallint/int/ ...

  8. 【Hive】Hive的数据类型

    Hive中数据类型可以分为基本数据类型和复合数据类型.这些数据类型都是用Java实现的. 1. 基本数据类型 类型名称 描述 举例 boolean true/false true tinyint 1b ...

  9. pythonsze_python学习笔记二 数据类型(基础篇)

    Python基础 对于Python,一切事物都是对象,对象基于类创建 不同类型的类可以创造出字符串,数字,列表这样的对象,比如"koka".24.['北京', '上海', '深圳' ...

最新文章

  1. 基于web的可定制数据填报平台
  2. J. Cheminform. | 基于SMILES的利用骨架的分子生成模型
  3. 语言在msin函数验证_R语言时间序列分析(七):模型准确度估计
  4. 淘宝文件系统大文件结构
  5. vue动态设置文字布局方式_详解Vue动态添加模板的几种方法
  6. Zabbix监控华为交换机CPU、温度并显示到拓扑图
  7. 5ic计算机考试考卷读取错误,最新计算机一级试题第五套
  8. jdbctemplate 开启事务_Spring(四):事务管理
  9. Python获取2019-nCoV疫情实时追踪数据
  10. 刚刚,华为云找到了更安全更卫生的乘坐电梯方式
  11. java arraylist
  12. 淘宝技术发展(分布式时代:服务化)
  13. 将Unix时间戳字符串转换为可读日期
  14. 海量数据挖掘MMDS week1: MapReduce
  15. C语言判断素数(求素数)
  16. dsm加密linux,要加速也要加密:群晖NAS DS918+评测
  17. matlab海底地形数据,海底地形建模器
  18. Mac 上 VMware 安装 win7 虚拟机如何添加磁盘
  19. Android判断软键盘 输入法 是否显示
  20. win10文件发生损毁,扫描系统并进行修复

热门文章

  1. 前缀树(字典树,单词查找树,Trie树)
  2. idea tomcat启动乱码问题
  3. [FJWC2018]全排列
  4. ovs ovn 学习资料
  5. Kotlin中变量不同于Java: var 对val(KAD 02)
  6. web.xml文件中的web-app元素 部署
  7. throw er; Unhandled 'error' event Error: listen EADDRINUSE的解决方法
  8. 开发一个手游需要的工种
  9. 中小企业什么OA办公系统适用呢?
  10. 关于ultrawebgrid的列的样式