Hive ANALYZE NOSCAN
参考官网:https://cwiki.apache.org/confluence/display/Hive/StatsDev
一、Hive分析统计语句如下:
ANALYZE TABLE [db_name.]tablename [PARTITION(partcol1[=val1], partcol2[=val2], ...)] -- (Note: Fully support qualified table name since Hive
1.2
.
0
, see HIVE-
10007
.)
COMPUTE STATISTICS
[FOR COLUMNS] -- (Note: Hive
0.10
.
0
and later.)
[CACHE METADATA] -- (Note: Hive
2.1
.
0
and later.)
[NOSCAN];
二、使用举例
--使用noscan,不会scan file,因此很快。但只能得到文件数numFiles
和HDFS存储空间大小totalSize
hive> ANALYZE TABLE qfqhqtest COMPUTE STATISTICS noscan;
Table default.qfqhqtest stats: [numFiles=1, numRows=0, totalSize=816618, rawDataSize=0]
-- 不使用scan,则会scan file,会得到行数 numRows和原始数据大小rawDataSize(未压缩),并更新到元数据表中,下次noscan也能得到这些字段
hive> ANALYZE TABLE qfqhqtest COMPUTE STATISTICS;
Table default.qfqhqtest stats: [numFiles=1, numRows=7867, totalSize=816618, rawDataSize=800884]
hive> ANALYZE TABLE qfqhqtest COMPUTE STATISTICS noscan;
Table default.qfqhqtest stats: [numFiles=1, numRows=7867, totalSize=816618, rawDataSize=800884]
OK
Time taken: 0.151 seconds
统计字段含义
Hive ANALYZE NOSCAN相关推荐
- Apache Hive on Apache Tez
Tez是Apache最新开源的支持DAG作业的计算框架,它直接源于MapReduce框架,核心思想是将Map和Reduce两个操作进一步拆分,即Map被拆分成Input.Processor.Sort. ...
- OLAP(三):Impala介绍 、 (和hive/spark对比)、COMPUTE STATS
一.Impala概述 Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎.与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟.换句话说,Impal ...
- Impala命令COMPUTE STATS的解析
Impala命令COMPUTE STATS的解析 COMPUTE STATS主要作用: 收集有关表中数据的容量和分布以及所有相关列和分区的信息.这些信息存储在metastore数据库中,Impala使 ...
- 袋鼠云产品功能更新报告01期丨用诚心倾听您的需求
作为一家以"客户第一"为价值观的公司,袋鼠云一直以来关注客户体验,专注提升产品品质,不断收集客户反馈,持续增加新功能并不断优化旧功能,为用户输出最佳产品使用体验.2022年上半年, ...
- Impala的命令COMPUTE STATS
COMPUTE STATS主要作用: 收集有关表中数据的容量和分布以及所有相关列和分区的信息.这些信息存储在metastore数据库中,Impala使用这些信息来帮助优化查询.例如,如果Impala可 ...
- 史上最详细大数据基础知识
# **1___Hive** ## 0.0.hive基本命令 ```sql [1.分区表] --创建分区 alter table table_name add partition(分区字段='分区值' ...
- Hive SQL查询效率提升之Analyze方案的实施
0.简介 Analyze,分析表(也称为计算统计信息)是一种内置的Hive操作,可以执行该操作来收集表上的元数据信息.这可以极大的改善表上的查询时间,因为它收集构成表中数据的行计数,文件计数和文件大小 ...
- 【Hive】性能调优 - EXPLAIN
Hive版本: hive-1.1.0-cdh5.14.2 用户提交HiveQL查询后,Hive会把查询语句转换为MapReduce作业.Hive会自动完成整个执行过程,一般情况下,我们并不用知道内部是 ...
- Hive学习笔记【全】
Hive学习笔记[全] 文章目录 Hive学习笔记[全] 一.Hive简介 1.Hive是什么 2.Hive的架构 3.Hive的数据组织 二.Hive安装 1.环境需求 2.安装Hive 3.启动H ...
- 7.Hive性能优化及Hive3新特性
1.Hive表设计优化 分区表优化查询速度 分桶表优化join速度 索引优化(在Hive3后移除,了解即可) 2.Hive表数据优化 2.1 文件格式 概述 Hive数据存储的本质市HDFS,所有数据 ...
最新文章
- Ubuntu 18 系统安装教程
- python服务器搭建ftp_Python搭建HTTP服务器和FTP服务器
- ml回归_ML中的分类和回归是什么?
- 【C++深度剖析教程11】C++学习之编写代码实现复数类
- bitcoin jsonrpc java_BitcoinCore JSONRPC Java使用创建账号,获取余额,转账等等...
- jinfo命令 Java Configuration Info
- php中的字符串常用函数(四) ord() 获得字符的ascii码 chr()获取ascii码对应的字符...
- esxi忘记密码重置方法
- vue $slot基本用法
- Python使用matplotlib可视化模拟闯红灯现象柱状图
- 我在用的多功能电子书阅读器
- 2022最新简历模板
- CFSSL 生成证书
- gavin中文是什么意思_Gavin[加文,盖温]英文名的中文翻译意思、发音、来源及流行趋势-千代英文名...
- 【Unity】3D雷霆战机
- Kubernetes:dashboard 搭建(k8s -web端管理)
- ubuntu下如何设置PageUp/PageDown键调出使用过的历史命令
- Monitoring(监控)
- Python是个啥?为啥大家都在学?
- rockchip研讨会_地下在线研讨会6
热门文章
- python南京招聘现状_岗位招聘情况分析之---Python
- Quartus 软内核NIOS II 入门指导
- 使无效html代码,blockquote p css无效,让blockquote p不缩进的方法
- 输入日期得出星座c语言,C++输入日期 判断所属星座
- 2037今年暑假不AC
- windows电脑截截屏截图的方法
- android apktool反编译,apktool反编译工具
- 微信小程序客服自动推送欢迎语php,如何实现小程序客服自动提示回复小程序卡片,弹出对应内容?小程序客服系统...
- 手机h5像素_h5移动端设备像素比dpr介绍
- ES新特性之Reflect对象