Flume HDFS Sink配置详解
Name | Default | Description |
---|---|---|
channel | – | |
type | – | 组件的名称,必须为:HDFS |
hdfs.path | – | HDFS目录路径,例如:hdfs://namenode/flume/webdata/ |
hdfs.filePrefix | FlumeData | HDFS目录中,由Flume创建的文件前缀。 |
hdfs.fileSuffix | – | 追加到文件的后缀,例如:.txt |
hdfs.inUsePrefix | – | 文件正在写入时的前缀。 |
hdfs.inUseSuffix |
.tmp
|
文件正在写入时的后缀。 |
hdfs.rollInterval | 30 | 当前写入的文件滚动间隔,默认30秒生成一个新的文件 (0 = 不滚动) |
hdfs.rollSize | 1024 | 以文件大小触发文件滚动,单位字节(0 = 不滚动) |
hdfs.rollCount | 10 |
以写入的事件数触发文件滚动。(0 = 不滚动) |
hdfs.idleTimeout | 0 | 超时多久以后关闭无效的文件。(0 = 禁用自动关闭的空闲文件)但是还是可能因为网络等多种原因导致,正在写的文件始终没有关闭,从而产生tmp文件 |
hdfs.batchSize | 100 | 有多少Event后,写到文件才刷新到HDFS。 |
hdfs.codeC | – | 压缩编解码器,可以使用:gzip, bzip2, lzo, lzop, snappy |
hdfs.fileType | SequenceFile |
文件格式:通常使用SequenceFile(默认) , DataStream 或者 CompressedStream (1)DataStream不能压缩输出文件,请不用设置hdfs.codeC编码解码器。(2)CompressedStream要求设置hdfs.codeC来制定一个有效的编码解码器。 |
hdfs.maxOpenFiles | 5000 | HDFS中允许打开文件的数据,如果数量超过了,最老的文件将被关闭。 |
hdfs.callTimeout | 10000 | 允许HDFS操作的毫秒数,例如:open,write, flush, close。如果很多HFDS操作超时,这个配置应该增大。 |
hdfs.threadsPoolSize | 10 |
每个HDFS sink的HDFS的IO操作线程数(例如:open,write) |
hdfs.rollTimerPoolSize | 1 | 每个HDFS sink调度定时文件滚动的线程数。 |
hdfs.kerberosPrincipal | – | 安全访问HDFS Kerberos的主用户。 |
hdfs.kerberosKeytab | – | 安全访问HDFS Kerberos keytab |
hdfs.proxyUser | ||
hdfs.round | false | 时间戳应该被四舍五入。(如果为true,会影响所有的时间,除了t%) |
hdfs.roundValue | 1 | 四舍五入的最高倍数(单位配置在hdfs.roundUnit),但是要小于当前时间。 |
hdfs.roundUnit | second |
四舍五入的单位,包含:second , minute or hour .
|
hdfs.timeZone | Local Time | 时区的名称,主要用来解决目录路径。例如:America/Los_Angeles |
hdfs.useLocalTimeStamp | false | 使用本地时间替换转义字符。 (而不是event header的时间戳) |
hdfs.closeTries | 0 | 在发起一个关闭命令后,HDFS sink必须尝试重命名文件的次数。如果设置为1,重命名失败后,HDFS sink不会再次尝试重命名该文件,这个文件处于打开状态,并且用.tmp作为扩展名。如果为0,Sink会一直尝试重命名,直至重命名成功。如果文件 失败,这个文件可能一直保持打开状态,但是这种情况下数据是完整的。文件将会在Flume下次重启时被关闭。 |
hdfs.retryInterval | 180 | 在几秒钟之间连续尝试关闭文件。每个关闭请求都会有多个RPC往返Namenode,因此设置的太低可能导致Namenode超负荷,如果设置0或者更小,如果第一次尝试失败的话,该Sink将不会尝试关闭文件。并且把文件打开,或者用“.tmp”作为扩展名。 |
serializer |
TEXT
|
可能的选项包括avro_event或继承了EventSerializer.Builder接口的类名。 |
serializer.* |
Flume HDFS Sink配置详解相关推荐
- hdfs 备份数配置_大数据||HDFS HA配置详解
根据HA架构图,规划HA的分布式集群服务器 HA集群规划 配置参考图 根据官方文档配置HA 部分说明 Architecture 在典型的ha集群中,两台独立的机器被配置为namenode.在任何时间点 ...
- 【收藏】hdfs参数配置详解
hdfs-site.xml 配置参数 hdfs-site.xml 参数配置
- Flume中的HDFS Sink配置
Flume中的HDFS Sink配置参数说明 type:hdfs path:hdfs的路径,需要包含文件系统标识,比如:hdfs://namenode/flume/webdata/ filePrefi ...
- 1.11.Flink DataSetAPI、DataSet API之Data Sources、DataSet API之Transformations、DataSet Sink部分详解
1.11.Flink DataSetAPI 1.11.1.DataSet API之Data Sources 1.11.2.DataSet API之Transformations 1.11.3.Data ...
- flume hdfs sink 文件滚动策略
一般使用hdfs sink都会采用滚动生成文件的方式,hdfs sink滚动生成文件的策略有: 基于时间 基于文件大小 基于hdfs文件副本数(一般要规避这种情况) 基于event数量 基于文件闲置时 ...
- 【深入理解Hadoop原理】Hadoop 参数配置 详解
Hadoop 参数配置 详解 一.常用端口 组件 节点 默认端口 配置 用途说明 HDFS DataNode 50010 dfs.datanode.address datanode服务端口,用于数据传 ...
- jmx_exporter 配置详解
jmx_exporter 配置详解 才疏学浅,欢迎大家提出意见或问题一起讨论 想要监控Java应用,JMX永远是第一选择.在prometheus监控体系中,jmx_exporter是使用范围十分广的工 ...
- elasticsearch-.yml(中文配置详解)
此elasticsearch-.yml配置文件,是在$ES_HOME/config/下 elasticsearch-.yml(中文配置详解) # ======================== El ...
- (ASA) Cisco Web ××× 配置详解 [三部曲之一]
(ASA) Cisco Web ××× 配置详解 [三部曲之一] 注意:本文仅对Web×××特性和配置作介绍,不包含SSL ×××配置,SSL ×××配置将在本版的后续文章中进行介绍. 首先,先来 ...
最新文章
- Ural 1025 Democracy in Danger 解题报告
- LeetCode 876——链表的中间结点
- (三)ajax请求不同源之websocket跨域
- 推荐系统笔记(深度学习)
- 磁带最优存储问题java实现_磁带的最优存储问题(贪心选择)
- centos mysql自动备份_CentOS下每天自动备份mysql数据库
- 程序员的崩溃,是从“你薪资比我高”开始的!
- linux安装selenium+chrome+phantomjs
- 黑白琴键 java_黑白琴键
- cpg数据库处理_找到未提取的pdf
- 基于 OS X Mavericks 系统
- 猪猪视频显示没有服务器,猪猪小视频软件
- 第八部分 项目资源管理
- Android中基于心知天气API获取天气信息
- 少儿编程教培管理系统介绍:源码+Scratch课程学习
- Kaggle(入门)
- 什么是交互设计?交互设计是做什么的?
- 跨考计算机面试英语自我介绍,2019考研复试面试英语自我介绍范文(2)
- 软件工程毕业设计课题(73)微信小程序毕业设计PHP菜谱美食小程序系统设计与实现
- Windows SDK DDK WDK (Windows Driver Kit) 区别
热门文章
- Zookeeper服务器动态上下线idea上server类中server.regist(args[0])数组越界解决
- 医通项目——使用EasyExcel创建Excel表格
- 什么是可重入函数, 不可重入函数? 哪些原因导致函数不可重入?
- hihi 我来了~
- 记一次TL-R479-GPE-AC V4.0 SSH破解
- 如何将Chrome谷歌浏览器的桌面快捷方式和任务栏快捷方式设置成默认打开无痕模式
- 不对齐 谷歌浏览器_这8个不为人知的高效隐藏技巧,让你的谷歌浏览器好用10倍!...
- Struts spring ibatis的集成(连载一)---转
- [Swift]LeetCode1025. 除数博弈 | Divisor Game
- Ubuntu 添加自动切换壁纸