适用于HDFS中存放结构化数据的场景,

先建一张外部表

CREATE EXTERNAL TABLE IF NOT EXISTS `ds_smart_log_idmapping`(`id` string COMMENT '包含wimei、wuser、telep、dimei和idfa', `ffaid` string COMMENT 'ffaidXXX',`timeStamp` string COMMENT '时间戳,用于聚合3-90d粒度数据')
COMMENT 'smart项目 ds层idmapping历史全量数据表'
PARTITIONED BY ( `dt` string COMMENT '日期yyyymmdd')
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t';

然后关联HDFS数据

alter table wbdb.ds_smart_log_idmapping add IF NOT EXISTS partition (dt="20190816") location 'viewfs://XXXXX/20190816';

这样就将HDFS上的结构化数据,导入外部表,可以直接通过sql语句来查询。

ps:建外部表,关联HDFS文件也有其他方式,但测试后发现这种方式最靠谱。

创建Hive外部表,关联HDFS文件相关推荐

  1. Hive 外部表关联分区数据

    0. 说明 已经安装好Hadoop和hive环境,hive把元数据存储在mysql数据库.这里仅讨论外部表和HDFS的关联,并且删掉外部表之后,对HDFS上的文件没有影响. 1. 在HDFS创建分区, ...

  2. Hive 外部表的练习(多表关联查询,以及分组,子查询)

    Hive 外部表的练习 hive创建库和表操作 hive加载数据,4种发放 1.数据放在Linux创建表结构 进行加载 2.先定义表结构.将一个查询select语句结果插入到表中 3.数据先放在hdf ...

  3. hive创建hbase外部表

    hive 启动命令:$HIVE_HOME/bin/hive hive 创建hbase外部表: ihr_pes为hive表名: CREATE EXTERNAL TABLE ihr_pes( id str ...

  4. hive外部表改为内部表_hive内部表外部表介绍

    未被external修饰的是内部表(managed table),被external修饰的为外部表(external table): 区别: 内部表数据由Hive自身管理,外部表数据由HDFS管理: ...

  5. hive外部表/内部表路径知识点

    1.hive创建外部表或者管理表是指定的位置信息是数据路径: create external table location '/user/externalhive/location/dir' 这里只定 ...

  6. hive外部表改为内部表_3000字揭秘Greenplum的外部数据加载——外部表

    外部表是greenplum的一种数据表,它与普通表不同的地方是:外部表是用来访问存储在greenplum数据库之外的数据.如普通表一样,可使用SQL对外部表进行查询和插入操作.外部表主要用于Green ...

  7. hive 外部表不支持添加列

    hive 外部表不支持添加列 其实在之前我也不知道,在官网上面也没有看到 在操作的时候才发现的 alter table hbase_fct_mcht_item_day add columns(avg_ ...

  8. SQL Server 2017 SELECT…INTO 创建的新表指定到文件组

    SQL Server 2017 SELECT-INTO 创建的新表指定到文件组 原文:SQL Server 2017 SELECT-INTO 创建的新表指定到文件组 SELECT-INTO 在 SQL ...

  9. spark如何正确的删除hive外部表【删除表时同时删除hdfs上的数据】?

    在spark 2.4.x和hive 3.1.x环境下,spark通过sql (drop table xxx)删除hive的外部表,只能删除hive的元数据信息,但没有删除hdfs上的数据,导致hdfs ...

最新文章

  1. bash 判断 os 版本_鸿蒙OS手机将至,华为手机用户提问,老款机器能升级吗?
  2. python求平方根的代码_Python求解平方根的方法
  3. php websocket 是否在线_看完让你彻底理解WebSocket原理,附实战代码(包含前端和后端)...
  4. Android中的广播Broadcast详解
  5. mysql的comment_mysql的comment怎么用
  6. HashMap、weakHashMap、LinkedHashMap和TreeMap四者区别与联系
  7. 2020年上海将初步建成“泛在化、融合化、智敏化”智慧城市
  8. 公司采购流程管理制度 大小公司通用
  9. C/C++手机通信录
  10. 【Photoshop文字排版小技巧】
  11. Centos 设置开机自动启动脚本
  12. Preferences DataStore------JAVA
  13. 基于PG与PostGIS搭建实时矢量瓦片服务
  14. 记云服务器中挖矿病毒与防范
  15. PTA新浪微博热门话题(题面毒瘤)
  16. 数据结构 单词查找 二分法-索引表-Hash表
  17. 微型计算机的alu部件包含在什么中,【单选题】微型计算机的ALU部件包括在( )之中。A. 存储器 B. I/O接口 C. O/I接口 D. CPU...
  18. 【git系列005】git分支学习
  19. [P4]p4 integrate/resolve/copy
  20. 软件工程之制定计划①(可行性研究报告、项目开发计划)

热门文章

  1. 大数据 就业 缺口_大数据就业前景广阔,大数据人才紧缺,岗位缺口大
  2. 开机后我的计算机打不开,电脑开机后图标打不开怎么办
  3. 数据技术-分析报告如何写
  4. 教你使用powerDesigner反向生成oracle数据库模型
  5. python写完后打不开门_感觉自己python已经入门了,为什么还是没法用Python写好程序?...
  6. SIGHUP信号与控制终端
  7. 编写一个静态方法lg(),接收一个整型参数N,返回不大于log2N(以2为底)的最大整数。不要使用Math库。
  8. 华新集团再冲刺港交所上市:上半年收入2.6亿元,张德红为董事长
  9. CSDN复制文章到Word保留样式方法
  10. 2022年618蓝牙耳机选什么牌子好?618性价比高的蓝牙耳机推荐