第一部分:Hive 参数

hive.exec.max.created.files

•说明:所有hive运行的map与reduce任务可以产生的文件的和

•默认值:100000

hive.exec.dynamic.partition

•说明:是否为自动分区

•默认值:false

hive.mapred.reduce.tasks.speculative.execution

•说明:是否打开推测执行

•默认值:true

hive.input.format

•说明:Hive默认的input format

•默认值: org.apache.hadoop.hive.ql.io.CombineHiveInputFormat

•如果有问题可以使用org.apache.hadoop.hive.ql.io.HiveInputFormat

hive.exec.counters.pull.interval

•说明:Hive与JobTracker拉取counter信息的时间

•默认值:1000ms

hive.script.recordreader

•说明:使用脚本时默认的读取类

•默认值: org.apache.hadoop.hive.ql.exec.TextRecordReader

hive.script.recordwriter

•说明:使用脚本时默认的数据写入类

•默认值: org.apache.hadoop.hive.ql.exec.TextRecordWriter

hive.mapjoin.check.memory.rows

•说明: 内存里可以存储数据的行数

•默认值: 100000

hive.mapjoin.smalltable.filesize

•说明:输入小表的文件大小的阀值,如果小于该值,就采用普通的join

•默认值: 25000000

hive.auto.convert.join

•说明:是不是依据输入文件的大小,将Join转成普通的Map Join

•默认值: false

hive.mapjoin.followby.gby.localtask.max.memory.usage

•说明:map join做group by 操作时,可以使用多大的内存来存储数据,如果数据太大,则不会保存在内存里

•默认值:0.55

hive.mapjoin.localtask.max.memory.usage

•说明:本地任务可以使用内存的百分比

•默认值: 0.90

hive.heartbeat.interval

•说明:在进行MapJoin与过滤操作时,发送心跳的时间

•默认值1000

hive.merge.size.per.task

•说明: 合并后文件的大小

•默认值: 256000000

hive.mergejob.maponly

•说明: 在只有Map任务的时候 合并输出结果

•默认值: true

hive.merge.mapredfiles

•默认值: 在作业结束的时候是否合并小文件

•说明: false

hive.merge.mapfiles

•说明:Map-Only Job是否合并小文件

•默认值:true

hive.hwi.listen.host

•说明:Hive UI 默认的host

•默认值:0.0.0.0

hive.hwi.listen.port

•说明:Ui监听端口

•默认值:9999

hive.exec.parallel.thread.number

•说明:hive可以并行处理Job的线程数

•默认值:8

hive.exec.parallel

•说明:是否并行提交任务

•默认值:false

hive.exec.compress.output

•说明:输出使用压缩

•默认值: false

hive.mapred.mode

•说明: MapReduce的操作的限制模式,操作的运行在该模式下没有什么限制

•默认值: nonstrict

hive.join.cache.size

•说明: join操作时,可以存在内存里的条数

•默认值: 25000

hive.mapjoin.cache.numrows

•说明: mapjoin 存在内存里的数据量

•默认值:25000

hive.join.emit.interval

•说明: 有连接时Hive在输出前,缓存的时间

•默认值: 1000

hive.optimize.groupby

•说明:在做分组统计时,是否使用bucket table

•默认值: true

hive.fileformat.check

•说明:是否检测文件输入格式

•默认值:true

hive.metastore.client.connect.retry.delay

•说明: client 连接失败时,retry的时间间隔

•默认值:1秒

hive.metastore.client.socket.timeout

•说明:  Client socket 的超时时间

•默认值:20秒

mapred.reduce.tasks

•默认值:-1

•说明:每个任务reduce的默认值

-1 代表自动根据作业的情况来设置reduce的值

hive.exec.reducers.bytes.per.reducer

•默认值: 1000000000 (1G)

•说明:每个reduce的接受的数据量

如果送到reduce的数据为10G,那么将生成10个reduce任务

hive.exec.reducers.max

•默认值:999

•说明: reduce的最大个数

hive.exec.reducers.max

•默认值:999

•说明: reduce的最大个数

hive.metastore.warehouse.dir

•默认值:/user/hive/warehouse

•说明: 默认的数据库存放位置

hive.default.fileformat

•默认值:TextFile

•说明: 默认的fileformat

hive.map.aggr

•默认值:true

•说明: Map端聚合,相当于combiner

hive.exec.max.dynamic.partitions.pernode

•默认值:100

•说明:每个任务节点可以产生的最大的分区数

hive.exec.max.dynamic.partitions

•默认值:1000

•说明: 默认的可以创建的分区数

hive.metastore.server.max.threads

•默认值:100000

•说明: metastore默认的最大的处理线程数

hive.metastore.server.min.threads

•默认值:200

•说明: metastore默认的最小的处理线程数

转载请注明出处【 http://sishuok.com/forum/blogPost/list/0/6225.html】

深入浅出学Hive:Hive参数相关推荐

  1. Hive 高级编程??深入浅出学Hive

    目录: 初始Hive Hive安装与配置 Hive 内建操作符与函数开发 Hive JDBC hive参数 Hive 高级编程 Hive QL Hive Shell 基本操作 hive 优化 Hive ...

  2. 深入浅出学Hive:Hive高级编程

    目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...

  3. 深入浅出学Hive:Hive优化

    目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...

  4. 深入浅出学Hive:Hive内建操作符与函数开发

    目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...

  5. 深入浅出学Hive——Hive原理

    目录: 初始Hive Hive安装与配置 Hive内建操作符与函数开发 Hive JDBC Hive参数 Hive高级编程 Hive QL Hive Shell基本操作 Hive优化 Hive体系结构 ...

  6. 深入浅出学Hive:Hive体系结构

    第一部分:概念 概念 •用户接口:用户访问Hive的入口 •元数据:Hive的用户信息与表的MetaData •解释器:分析翻译HQL的组件 •编译器:编译HQL的组件 •优化器:优化HQL的组件 第 ...

  7. [Hive_add_8] Hive 常用参数配置

    0. 说明 记录 Hive 常用参数的配置 1. 设置本地模式 让 Hive 自动使用 Hadoop 的本地模式运行作业,提升处理性能 适合小文件,一般用于测试 set hive.exec.mode. ...

  8. hive常用参数配置设置

    hive.exec.mode.local.auto  决定 Hive 是否应该自动地根据输入文件大小,在本地运行(在GateWay运行)  true hive.exec.mode.local.auto ...

  9. Hive基本操作,DDL操作(创建表,修改表,显示命令),DML操作(Load Insert Select),Hive Join,Hive Shell参数(内置运算符、内置函数)等

    1.  Hive基本操作 1.1DDL操作 1.1.1    创建表 建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_nam ...

  10. [Hive] - Hive参数含义详解

    hive中参数分为三类,第一种system环境变量信息,是系统环境变量信息:第二种是env环境变量信息,是当前用户环境变量信息:第三种是hive参数变量信息,是由hive-site.xml文件定义的以 ...

最新文章

  1. wondows下安装matplotlib(python包)
  2. torch.ge,torch.gt,torch.le
  3. [C++对象模型][9]虚继承与虚函数表
  4. 分布式项目 cookie共享方案
  5. 嵌入式论文3000字_SCI英文论文一般多少字
  6. 【做题记录】max-min+1=len 区间计数
  7. 总结: C++ 中如何把输出结果写入到文件中
  8. bigdecimal 怎么做除法_面向对象之BigDecimal
  9. OpenCms显示默认作者
  10. 腾讯云学生机(官网入口)
  11. 如何永久性取消WPS热点推广
  12. 手机测试内存速度的软件,如何查看手机内存速度?手机内存读取速度测试_手机内存速度多少算正常...
  13. hover鼠标的悬停效果
  14. ZXing 相册中识别二维码和条形码(直接引用就可以了)
  15. 如何批量将多个 PPT 文档快速合并成一个文档
  16. 做人要低调,绝对经典的低调
  17. Ghost 8.2 +GHOST使用教程(图+文)
  18. Ti的可调电流源芯片XTR111中文翻译手册
  19. php+mysql分页公式
  20. 2022世界人工智能大会 “智慧金融与数字员工”分论坛在沪成功举办

热门文章

  1. html开启页面离线缓存,HTML5 离线缓存
  2. php 内置mail 包,配置php自带的mail功能
  3. FatFs源码剖析(1)
  4. 中导入pygame_Pygame(二)--线条的艺术
  5. webmagic 获取文本_学习使用Java的webmagic框架爬取网页内容
  6. php按照字段合并数组,PHP实现数组根据某个字段进行水平合并横向合并代码实例...
  7. java的object有show_Java中 Object的方法
  8. 伯克利计算机科学研究生,加州大学伯克利分校
  9. mysql 8.0 集群_集群架构03·MySQL初识,mysql8.0环境安装,mysql多实例
  10. 二维数组求最小值_05-最大子矩形-最大值减去最小值小于或等于num的子数组数量...