Hive(二)——数据类型与文件格式
Hive(二)——数据类型与文件格式
数据
基本数据类型
集合数据类型
分隔符
# 数据:
John Doe^A100000.0^AMary Smith^BTodd Jones^AFederal Taxes^C.2^BStateTaxes^C.05^ BInsurance^C.1^A1 Michigan Ave.^BChicago^BIL^B60600{"name": "John Doe","salary": 100000.0,"subordinates": ["Mary Smith", "Todd Jones"],"deductions": {"Federal Taxes": .2,"State Taxes": .05,"Insurance": .1},"address": {"street": "1 Michigan Ave.","city": "Chicago","state": "IL","zip": 60600}
}
# 例:
CREATE TABLE employees (name STRING,salary FLOAT,subordinates ARRAY<STRING>,deductions MAP<STRING, FLOAT>,address STRUCT<street:STRING, city:STRING, state:STRING, zip:INT>)
ROW FORMAT DELIMITED # ROW FORMAT DELIMITED这组关键字必须要写在其他子句(除了STORED AS ... 子句)之前
FIELDS TERMINATED BY '\001'
COLLECTION ITEMS TERMINATED BY '\002'
MAP KEYS TERMINATED BY '\003'
LINES TERMINATED BY '\n' # 子句LINES TERMINATED BY '…'和STORED AS …不需要ROW FORMAT DELIMITED关键字
STORED AS TEXTFILE; # Hive到目前为止对于LINESTERMINATED BY …仅支持字符‘\n’,也就是说行与行之间的分隔符只能为‘\n’
如果一个表表结构指定三个字段,而数据文件有五列,则后两列会被舍弃
如果某些字段是数值型的,但是Hive在读取时发现存在非数值型的字符串值的话,那么对于那些字段将会返回null值。————读时模式
如果数据库非常多的话,那么可以使用正则表达式匹配来筛选出需要的数据库名
hive >show databases like 'h.*';
建库语句使用LOCATION关键字可指定数据库位置(默认hive.metastore.warehouse.dir)
hive> CREATE DATABASE financials> LOCATION '/my/preferred/directory';
默认情况下,Hive是不允许用户删除一个包含有表的数据库的。用户要么先删除数据库中的表,然后再删除数据库;要么在删除命令的最后面加上关键字CASCADE,这样可以使Hive自行先删除数据库中的表
hive > DROP DATABASE IF EXISTS finacials CASCADE;
用户可以使用ALTER DATABASE命令为某个数据库的DBPROPERTIES设置键-值对属性值,来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的,包括数据库名和数据库所在的目录位置
hive > ALTER DATABASE financials SET DBPROPERTIES ('edited-by' = 'Joe Dba');
Hive(二)——数据类型与文件格式相关推荐
- linux hive查询数据类型,04-hive的数据类型
转载请注明~ 在学习了Linux系统操作命令和shell编程之后,将进入到hive的学习中,先主要介绍hive的数据类型和文件格式. 01数据类型 基本数据类型 Hive 提供了基本数据类型和复杂数据 ...
- 谈笑间学会大数据-Hive数据类型和文件格式
Hive数据类型和文件格式 目录 Hive数据类型和文件格式 Hive数据类型 数据类型的意义 hive基本数据类型 集合数据类型 文本文件数据编码 读时模式 hive存储格式类型 Hive数据类型 ...
- 【python opencv 计算机视觉零基础到实战】二、 opencv文件格式与摄像头读取
一.学习目标 了解图片的结构属性 了解如何捕获视频 了解waitkey的使用方法 目录 [python opencv 计算机视觉零基础到实战] 一.opencv的helloworld [[python ...
- bigint hive java类型_三十、Hive的数据类型以及常用的属性配置
上篇文章我们在服务器上部署了Hive并将它的Metastore存储在了MySQL上,本文介绍一下Hive的数据类型以及常用的一些属性配置.关注专栏<破茧成蝶--大数据篇>,查看更多相关的内 ...
- 三十、Hive的数据类型以及常用的属性配置
上篇文章我们在服务器上部署了Hive并将它的Metastore存储在了MySQL上,本文介绍一下Hive的数据类型以及常用的一些属性配置.关注专栏<破茧成蝶--大数据篇>,查看更多相关的内 ...
- C#2.0实例程序STEP BY STEP--实例二:数据类型
C#2.0实例程序STEP BY STEP--实例二:数据类型 与其他.NET语言一样,C#支持Common Type Sysem(CTS),其中的数据类型集合不仅包含我们熟悉的基本类型,例如int, ...
- Hive学习笔记 —— Hive的数据类型
Hive本质上是一个数据库,可以创建表,表有列组成,而列支持的主要类型有:基本数据类型.复杂数据类型.时间数据类型. 1. Hive的数据类型之基本数据类型 tinyint/smallint/int/ ...
- 【Hive】Hive的数据类型
Hive中数据类型可以分为基本数据类型和复合数据类型.这些数据类型都是用Java实现的. 1. 基本数据类型 类型名称 描述 举例 boolean true/false true tinyint 1b ...
- pythonsze_python学习笔记二 数据类型(基础篇)
Python基础 对于Python,一切事物都是对象,对象基于类创建 不同类型的类可以创造出字符串,数字,列表这样的对象,比如"koka".24.['北京', '上海', '深圳' ...
最新文章
- 基于web的可定制数据填报平台
- J. Cheminform. | 基于SMILES的利用骨架的分子生成模型
- 语言在msin函数验证_R语言时间序列分析(七):模型准确度估计
- 淘宝文件系统大文件结构
- vue动态设置文字布局方式_详解Vue动态添加模板的几种方法
- Zabbix监控华为交换机CPU、温度并显示到拓扑图
- 5ic计算机考试考卷读取错误,最新计算机一级试题第五套
- jdbctemplate 开启事务_Spring(四):事务管理
- Python获取2019-nCoV疫情实时追踪数据
- 刚刚,华为云找到了更安全更卫生的乘坐电梯方式
- java arraylist
- 淘宝技术发展(分布式时代:服务化)
- 将Unix时间戳字符串转换为可读日期
- 海量数据挖掘MMDS week1: MapReduce
- C语言判断素数(求素数)
- dsm加密linux,要加速也要加密:群晖NAS DS918+评测
- matlab海底地形数据,海底地形建模器
- Mac 上 VMware 安装 win7 虚拟机如何添加磁盘
- Android判断软键盘 输入法 是否显示
- win10文件发生损毁,扫描系统并进行修复