大数据:数据采集平台之Fluentd


  1. Apache Flume
    详情请看文章:《大数据:数据采集平台之Apache Flume》

  2. Fluentd
    详情请看文章:《大数据:数据采集平台之Fluentd》

  3. Logstash
    详情请看文章:《大数据:数据采集平台之Logstash》

  4. Apache Chukwa
    详情请看文章:《大数据:数据采集平台之Apache Chukwa 》

  5. Scribe
    详情请看文章:《大数据:数据采集平台之Scribe 》

  6. Splunk Forwarder
    详情请看文章:《大数据:数据采集平台之Splunk Forwarder》


官网: http://docs.fluentd.org/articles/quickstart

Fluentd是一个开源的数据收集框架。Fluentd使用C/Ruby开发,使用JSON文件来统一日志数据。它的可插拔架构,支持各种不同种类和格式的数据源和数据输出。最后它也同时提供了高可靠和很好的扩展性。Treasure Data, Inc 对该产品提供支持和维护。

Fluentd的部署与架构设计和Flume非常相似:

Fluentd的Input/Buffer/Output非常类似于Flume的Source/Channel/Sink。

  1. Input:Input负责接收数据或者主动抓取数据。支持syslog,http,file tail等。

  2. Buffer:Buffer负责数据获取的性能和可靠性,也有文件或内存等不同类型的Buffer可以配置。

  3. Output:Output负责输出数据到目的地例如文件,AWS S3或者其它的Fluentd。

Fluentd的配置非常方便,如下图:

Fluentd的技术栈如下图:

FLuentd和其插件都是由Ruby开发,MessgaePack提供了JSON的序列化和异步的并行通信RPC机制。

Cool.io是基于libev的事件驱动框架。

FLuentd的扩展性非常好,客户可以自己定制(Ruby)Input/Buffer/Output。

Fluentd从各方面看都很像Flume,区别是使用Ruby开发,Footprint会小一些,但是也带来了跨平台的问题,并不能支持Windows平台。另外采用JSON统一数据/日志格式是它的另一个特点。相对去Flumed,配置也相对简单一些。

参考:https://mp.weixin.qq.com/s/emQ_94T0_Hw3ywQc0-4Dtg

大数据:数据采集平台之Fluentd相关推荐

  1. 阿里巴巴大数据计算平台MaxCompute(原名ODPS)全套攻略(持续更新20171127)

    概况介绍 大数据计算服务(MaxCompute,原名ODPS,产品地址:https://www.aliyun.com/product/odps)是一种快速.完全托管的TB/PB级数据仓库解决方案.Ma ...

  2. 普元王葱权:数字化时代需要新一代的大数据应用平台架构

    记者 | 杨丽 出品 | AI 科技大本营(rgznai100) 2018 年 12 月 6 日,北京新云南皇冠假日酒店,由中国计算机学会主办,CCF 大数据专家委员会承办,CSDN.中科天玑数据科技 ...

  3. 【2017年第2期】应用驱动的大数据融合平台建设

    孟祥飞, 冯景华, 赵洋, 夏梓峻 国家超级计算天津中心,天津 300457 摘要:论述了大数据在信息社会发展中的核心地位和对信息技术创新的全方位驱动:重点阐述了应用驱动的大数据和超级计算.云计算融合 ...

  4. 银行大数据风控平台的建设要点与应用

    金融行业是经营风险的行业,风险控制能力是金融机构的核心竞争力.通常而言,金融机构一般是通过给客户的信用状况评分来计量贷款违约的可能性,并通过客户的风险水平进行利率定价. 而传统的信用测算主要是利用历史 ...

  5. 大数据建设意义_大数据一体化平台打造政府智能数据库,助力智慧政务建设

    更多资讯:探码科技 智慧政务的发展现状 随着5G智能化的不断发展,各行各业已经逐步迈入行业发展与智能化相互结合的阶段,不断产生和出现新的行业经营模式,因而产生了诸如智慧医疗.智慧商业.智慧政务等等智慧 ...

  6. 如何设计一个大数据实时分析平台

    大数据实时分析平台(以下简称PB-S),旨在提供数据端到端实时处理能力(毫秒级/秒级/分钟级延迟),可以对接多数据源进行实时数据抽取,可以为多数据应用场景提供实时数据消费.作为现代数仓的一部分,PB- ...

  7. 大数据实时分析平台应用在哪些场景

    大数据平台主要是解决对海量多样化的数据源进行数据采集.数据存储,数据分析和数据处理,并提供满足日渐增长的扩展性要求.大数据平台的应用场景,大致可分为如下几个: 场景一:舆情分析 有的客户需要做舆情分析 ...

  8. 大数据技术平台主要分为哪几类

    大数据的处理过程可以分为大数据采集.存储.结构化处理.隐私保护.挖掘.结果展示(发布)等,各种领域的大数据应用一般都会涉及到这些基本过程,但不同应用可能会有所侧重.对于互联网大数据而言,由于其具有独特 ...

  9. 星火计划 | Apache InLong一站式大数据接入平台沙龙火热报名中

    导语:随着数据的增长以及业务场景的多元化,消息中间件已经成为IT架构中不可或缺的组件.它可以降低系统间的耦合性与复杂度,提升系统稳定性,为大数据时代的数据采集提供巨大助力. 腾讯大数据在2013年自研 ...

最新文章

  1. layui table行点击tr_layui框架table表格实现单击行选中checkbox功能
  2. 如何设置电脑锁屏时间_电脑如何设置多屏显示?多屏显示的设置方法
  3. install kinect driver for ARM---38
  4. 扫地机器人什么牌子好?专业人士推荐这五款高端产品
  5. ICCV2021 | 南洋理工大学、港中大提出Talk-to-Edit,对话实现高细粒度人脸编辑
  6. java如何关闭线程池_如何优雅的关闭Java线程池
  7. [C] strncpy 函数
  8. VS错误之error LNK2019: 无法解析的外部符号
  9. 来电振铃时按音量键静音
  10. linux 区别 挂起 阻塞_踩坑之java执行linux命令死锁阻塞挂起
  11. 电脑XP系统开机速度变慢12种解决办法
  12. verilog REG 寄存器、向量、整数、实数、时间寄存器
  13. 大数据的核心架构层是哪些?
  14. easyui datagrid 多列排序,该如何处理[多列同时order,只针对某一列order]
  15. jsp游戏补丁共享网站设计
  16. java_secret_dire宝典
  17. SOCKET 实现NAT 穿越
  18. 【数据挖掘】天池挑战赛 新闻推荐
  19. MySQL_Windows 下重启MySQL服务
  20. kali linux 工具使用之 001 dnsenum

热门文章

  1. 是否只查看安全传送的网页内容? 去掉 IE弹出窗口
  2. openwrt系统安装到云服务器,openwrt安装到云服务器
  3. 京东开店要多少钱?需要什么条件?在京东开店后遇到问题怎么办?
  4. Android Gallery画廊 兼容4.0以上版本
  5. 四个月某机构前端培训JS(五)
  6. 基于opencv tensorflow2.0开发的人脸识别锁定与解锁win10屏幕实战
  7. 数据如何归一化matlab中,数据归一化汇总
  8. 基于哔哩哔哩王红元(coderwhy)老师Vue学习课程的超详细学习笔记以及代码示例
  9. 【一棵开花的树】 席慕容
  10. heartbeat下载地址