Hive的数据模型-管理表
概述
管理表,也称作内部表,受控表。
所有的 Table 数据(不包括 External Table)都保存在warehouse这个目录中。
删除表时,元数据与数据都会被删除。
在加载数据的过程中,实际数据会被移动到数据仓库目录中;之后对数据对访问将会直接在数据仓库目录中完成。删除表时,表中的数据和元数据将会被同时删除。
操作
创建数据文件
inner_table.dat
创建表
hive>create table inner_table (key string);
加载数据
hive>load data local inpath '/root/inner_table.dat' into table inner_table;
查看数据
select * from inner_table
select count(*) from inner_table
删除表 drop table inner_table
缺点
假设,t1表的文件路径在/home
t2表的文件路径在/home/t2
当删除t1表时,会把/home下的都删了。这是很危险的,所以实际开发中,不用管理表,很容易导致数据丢失。
修改管理表为外部表
alter table t1 set tblpropertise('EXTERNAL'='TRUE');
EXTERNAL,TRUE 这个词必须大写,改回内部表用FALSE
---------------------------------------------------------------
hive (default)> desc formatted map_test;
OK
col_name data_type comment
# col_name data_type comment
id string
perf map<string,int>
# Detailed Table Information
Database: default
Owner: hadoop
CreateTime: Wed Aug 31 20:15:40 CST 2016
LastAccessTime: UNKNOWN
Retention: 0
Location: hdfs://hello110:9000/user/hive/warehouse/map_test
Table Type: MANAGED_TABLE
Table Parameters:
COLUMN_STATS_ACCURATE {\"BASIC_STATS\":\"true\"}
numFiles 0
numRows 0
rawDataSize 0
totalSize 0
transient_lastDdlTime 1472645800
# Storage Information
SerDe Library: org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe
InputFormat: org.apache.hadoop.mapred.TextInputFormat
OutputFormat: org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat
Compressed: No
Num Buckets: -1
Bucket Columns: []
Sort Columns: []
Storage Desc Params:
colelction.delim ,
field.delim \t
mapkey.delim :
serialization.format \t
Time taken: 0.383 seconds, Fetched: 34 row(s)
Hive的数据模型-管理表相关推荐
- Hive的数据模型—桶表
概述 桶表是对数据进行哈希取值,然后放到不同文件中存储. 数据加载到桶表时,会对字段取hash值,然后与桶的数量取模.把数据放到对应的文件中. 物理上,每个桶就是表(或分区)目录里的一个文件,一个作业 ...
- Hive的数据模型-外部表
概述 包含External 的表叫外部表 删除外部表只删除metastore的元数据,不删除hdfs中的表数据 外部表 只有一个过程,加载数据和创建表同时完成,并不会移动到数据仓库目录中,只是与外部数 ...
- Hive之管理表 外部表 分区表
一Hive 创建表的三种方式 1.1普通创建 1.2查询语句创建 CREATETABLE IF NOT EXISTS ext_1 AS SELECT deptno,dname,loc FROMdept ...
- hive 创建外部表产生java_(一)Hive表(管理表、外部表)的创建规则
建表语句: CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...
- 数据仓库Hive编程——HiveQL的数据操作(一):向管理表中装载数据
既然Hive没有行级别的数据插入.数据更新和删除操作,那么往表中装载数据的唯一途径就是使用一种"大量"的数据装载操作.或者通过其他方式仅仅将文件写入到正确的目录下. 在<Hi ...
- Hive用户权限管理理解
HiverServer2支持远程多客户端的并发和认证,支持通过JDBC.Beeline等连接操作.hive默认的Derby数据库,由于是内嵌的文件数据库,只支持一个用户的操作访问,支持多用户需用mys ...
- 六、Hive中的内部表、外部表、分区表和分桶表
文章目录 内部表 外部表 分区表 分桶表 在Hive数据仓库中,重要点就是Hive中的四个表.Hive 中的表分为内部表.外部表.分区表和分桶表. 内部表 默认创建的表都是所谓的内部表,有时也被称为管 ...
- Hive精华问答 | Hive的数据模型是怎样的?
Hive是一个数据仓库基础工具,它是建立在Hadoop之上的数据仓库,在某种程度上可以把它看做用户编程接口(API),本身也并不存储和处理数据,依赖于HDFS存储数据,依赖MR处理数据.它提供了一系列 ...
- hive 操作(三)——hive 的数据模型
Hive 基础及安装 Hive 操作(一) hive 操作(二)--使用 mysql 作为 hive 的metastore hive 操作(三)--hive 的数据模型 hive 操作(四) 大的分类 ...
最新文章
- 使用SVG中的Symbol元素制作Icon
- python的用途-Python运算符的作用与意义
- 越南黑客组织APT32正对NSA网络武器开展研究利用
- prim算法 求最小生成树
- php 租房子(练习题)
- client心跳 websocket_理解websocket的原理
- OpenCV-Python实战(19)——OpenCV与深度学习的碰撞
- 自动驾驶汽车如何解决复杂交互问题?清华联合MIT提出M2I方案
- jquery ui accordion的详细参数
- 清华大学李涓子教授:AI系统如何实现认知推理?
- python 谷歌翻译
- 2021牛客多校9.F.Train Wreck 构造
- 重磅!程序员工资不会上涨的几个现象
- Android anr模拟,ANR 的模拟
- FZU - 1759 Problem 1759 Super A^B mod C 欧拉降幂公式
- oracle导入dmp文件数据不全,oracle导入dmp文件(恢复数据)
- 利用python提取企查查企业的工商基本信息
- DDD之实体与值对象区别
- 有了ElasticSearch为什么还要用MySQL?-这篇文章告诉你
- python哪里培训
热门文章
- huffman编码的程序流程图_F28379D之CLB解码多摩川编码器2——LIB版例程讲解(原创)...
- layui 分页ajax,实现Ajax异步的layui分页
- vnc用户名 查看linux_vnc用户名未被识别,5步教你如何解决vnc用户名未被识别
- SpringMVC+FreeMarker
- codesys com库_CoDeSys官方系统库在线下载,替换国内下载服务器教程
- git 切换分支_git 入门教程之分支总览
- linux查看java虚拟机内存_深入理解java虚拟机(linux与jvm内存关系)
- distinct返回null报错_C#之集合常用扩展方法与Linq
- 屏幕坏点检测图片_iPhone新机如何检测质量 iPhone新机检测质量步骤【详解】
- 64位ubuntu arm-linux-gcc,在ubuntu 64位的机器上执行arm-linux-gcc提示 no such file or directory【转】...