玩过Oracle的同学一定知道rowid=objectid+file#+block#+row#这个概念,其实在Hive里也有“Rowid”.

Hive里有虚拟列的概念,类似于Oracle里的伪列,其中三个虚拟列是:INPUT__FILE__NAME,BLOCK__OFFSET__INSIDE__FILE,ROW__OFFSET__INSIDE__BLOCK.

INPUT__FILE__NAME:MAPREDUCE读取的文件的URI

BLOCK__OFFSET__INSIDE__FILE:For blockCompressed files,表示RCFile Block orSequenceFile 当前块在文件中的偏移量;For non-block-compressedfiles, 表示当前行的偏移量.

ROW__OFFSET__INSIDE__BLOCK:当打开参数hive.exec.rowoffset(默认关闭)时会开启这个虚拟列特性,For non-block-compressed files这个值一直为0,否则表示行号.

本文转自MIKE老毕 51CTO博客,原文链接:http://blog.51cto.com/boylook/1336763,如需转载请自行联系原作者

Hive的“rowid”相关推荐

  1. 史上最详细大数据基础知识

    # **1___Hive** ## 0.0.hive基本命令 ```sql [1.分区表] --创建分区 alter table table_name add partition(分区字段='分区值' ...

  2. 1.python 根据 oracle字段名和类型 生成 hive建表语句

    一.问题 遇到一个场景,要根据oracle表结构创建hive表. 本来想写一个根据oracle信息和表名自动在hive中创建表的脚本.如果在集群运行,python操作oracle的cx_Oracle在 ...

  3. 2021年大数据Hive(十二):Hive综合案例!!!

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive综合案例 一.需求描述 二.项目表的字段 三.进 ...

  4. 2021年大数据Hive(十一):Hive调优

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive调优 一.本地模式 1.空key处理 二.SQL ...

  5. 2021年大数据Hive(九):Hive的数据压缩

    全网最详细的大数据Hive文章系列,强烈建议收藏加关注! 新文章都已经列出历史文章目录,帮助大家回顾前面的知识重点. 目录 系列历史文章 前言 Hive的数据压缩 一.MR支持的压缩编码 二.压缩配置 ...

  6. 2021年大数据Hive(八):Hive自定义函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive自定义函数 一.概述 1.UDF(User-Define ...

  7. 2021年大数据Hive(七):Hive的开窗函数

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的开窗函数 一.窗口函数 ROW_NUMBER,RANK ...

  8. 2021年大数据Hive(五):Hive的内置函数(数学、字符串、日期、条件、转换、行转列)

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 Hive的内置函数 一.数学函数 1. 取整函数: round ...

  9. 2021年大数据Hive(四):Hive查询语法

    全网最详细的Hive文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 系列历史文章 前言 hive查询语法 一.SELECT语句 1.语句结构 2.全表查 ...

最新文章

  1. 京东 | AI人才联合培养计划!
  2. docker latest标签问题
  3. ios mdm更新应用_因使用MDM下架的家长控制应用OurPact重返App Store
  4. 一个程序猿如何自学双截棍,避免各种编程职业病的发生?
  5. php 判断两个数组差集,php array_udiff_assoc 计算两个数组的差集实例
  6. python中列表的常用操作
  7. [HTML5实现人工智能]小游戏《井字棋》发布,据说IQ上200才能赢
  8. vim替换字符串带斜杠_Vim:正则表达式匹配一个字符串
  9. 历时半载,我的新课上线了
  10. mysql如何彻底卸载_windows如何彻底卸载mysql
  11. wine模拟器安装xshell
  12. c语言实验八 二维数组,☆C语言实验六(二维数组、字符串数组).doc
  13. svg图标四周有空隙
  14. Pytorch基础操作 —— 8. 张量转置操作
  15. 教你如何安慰失戀人?
  16. 垂直搜索 vs 通用搜索
  17. 新年了,5G手机芯片,到底买谁?
  18. linux元年时间搓,发布基于ANSI-C的RTC_Time库,利用UNIX时间戳格式,无中断实现万年历...
  19. win11小组件关闭的详细教程
  20. 数据结构算法——1089. 路由器

热门文章

  1. Space X的火箭上天,Tesla的业绩落地
  2. 为什么 Linux 需要 Swapping
  3. Spring Boot 和Apache Kafka的集成
  4. 在MySQL数据库中,这4种方式可以避免重复的插入数据!
  5. 面试官问:MySQL 的自增 ID 用完了,怎么办?
  6. Spring MVC 到 Spring BOOT 的简化之路
  7. 可能是东半球最好的 Curl 学习指南,强烈建议收藏!
  8. 我的4年学习心得:AI 应该是一个整体!
  9. 10篇顶会paper,入选微软学者,上海交大吴齐天的科研思考!
  10. 通俗讲解从Transformer到BERT模型!