目录

写在最前:为什么做日志收集系统❓

一、多种日志收集工具比较

1、背景介绍

2、Facebook 的 Scribe

3、Apache 的 Chukwa

4、LinkedIn 的 Kafka

5、Cloudera 的 Flume OG

6、“星星”小结

7、众星捧月之 Apache 的 Flume NG

Flume NG 架构:

Flume NG 特性:

Flume NG 节点组成图:

Flume NG 常用组件

删减节点角色,脱离 zookeeper

用户配置变化之安装

用户配置变化之数据传输配置

结束语

二、分布式日志收集框架 Flume NG


写在最前:为什么做日志收集系统❓

首先,什么是日志?日志就是程序产生的,遵循一定格式(通常包含时间戳)的文本数据。

通常日志由服务器生成,输出到不同的文件中,一般会有系统日志、应用日志、安全日志。这些日志分散地存储在不同的机器上。

当系统发生故障时,工程师就需要登录到各个服务器上,使用 grep / sed / awk 等 Linux 脚本工具去日志里查找故障原因。在没有日志系统的情况下,首先需要定位处理请求的服务器,如果这台服务器部署了多个实例,则需要去每个应用实例的日志目录下去找日志文件。每个应用实例还会设置日志滚动策略(如:每天生成一个文件或日志文件达到某给定大小后生成一个文件),还有日志压缩归档策略等。

这样一系列流程下来,对于我们排查故障以及及时找到故障原因,造成了比较大的麻烦。因此,如果我们能把这些日志集中管理,并提供集中检索功能,不仅可以提供高诊断效率,同时对系统情况有个全面的理解,避免事后救火的被动。

个人认为,日志数据在以下几个方面具有非常重要的作用:

  • 数据查找:通过检索日志信息,定位相应的 bug,找出解决方案;
  • 服务诊断:通过对日志信息进行统计、分析,了解服务器的负荷和服务运行状态;
  • 数据分析:可以做进一步的数据分析。

一、多种日志收集工具比较

1、背景介绍

许多公司的平台每天会产生大量的日志(一般为流式数据,如搜索引擎 pv、uv,查询等),处理这些日志需要特定的日至系统,一般而言,这些系统需要具备以下特征:

  • 构建应用系统和分析系统的桥梁,并将它们之间的关联解耦合;
  • 支持近时时的在线分析系统和类似于 Hadoop 之类的离线分析系统;
  • 具有高可扩展性。即:当数据量增加时,可以通过增加节点进行水平扩展。

分布式日志收集工具分析比较相关推荐

  1. 大数据运维实战第十七课 日志收集、分析过滤工具 Logstash应用实战

    本课时主要讲解"日志收集.分析过滤工具 Logstash 应用实战". Logstash 介绍与安装 Logstash 是一款轻量级的.开源的日志收集处理框架,它可以方便地把分散的 ...

  2. 便捷的日志收集和分析工具TFA

    转自https://blogs.oracle.com/database4cn/tfa 1. 便捷的日志收集和分析工具Trace File Analyzer 客户在和技术支持的工程师解决GI(RAC)问 ...

  3. RAC日志收集和分析工具TFA

    TFA是在11.2版本上推出的用来收集Grid Infrastructure/RAC环境下的诊断日志的工具,它可以用非常简单的命令协助用户收集RAC里的日志,下面从几个方面介绍: 1. 便捷的日志收集 ...

  4. 分布式日志收集系统Apache Flume的设计详细介绍

    问题导读: 1.Flume传输的数据的基本单位是是什么? 2.Event是什么,流向是怎么样的? 3.Source:完成对日志数据的收集,分成什么打入Channel中? 4.Channel的作用是什么 ...

  5. ELK分布式日志收集搭建和使用

    大型系统分布式日志采集系统ELK 全框架 SpringBootSecurity 1.传统系统日志收集的问题 2.Logstash操作工作原理 3.分布式日志收集ELK原理 4.Elasticsearc ...

  6. Scribe日志收集工具

    Scribe日志收集工具 概述 Scribe是facebook开源的日志收集系统,在facebook内部已经得到大量的应用.它能够从各种日志源上收集日志,存储到一个中央存储系统(可以是NFS,分布式文 ...

  7. 使用ELK搭建日志收集和分析系统

    搭建日志收集和分析系统需要以下步骤: 安装Java运行环境 ELK是基于Java开发的,因此需要在服务器上安装Java运行环境 安装Elasticsearch Elasticsearch是ELK的核心 ...

  8. 一起来解读分布式日志收集系统:Facebook Scribe

    1.分布式日志收集系统:背景介绍 许多公司的平台每天会产生大量的日志(一般为流式数据,如,搜索引擎的pv,查询等),处理这些日志需要特定的日志系统,一般而言,这些系统需要具有以下特征: (1) 构建应 ...

  9. 分布式日志收集系统: Facebook Scribe

    转载于博主新浪微博:http://weibo.com/freshairbrucewoo. 欢迎大家相互交流,共同提高技术. 以下是我在公司内部分享的关于分布式日志收集系统的PPT内容,现在与大家分享, ...

最新文章

  1. Python中的过滤器
  2. 编写高质量的Objective-C代码
  3. SharePoint 向多行文本类型字段插入特殊类型链接
  4. 下面使用计算机动画制作的,华师17年3月课程考试《计算机动画制作》作业考核试题...
  5. 面向对象的三大特性之三:封装
  6. Pytorch常用技巧记录
  7. 计算机完成双系统无法启动怎么办,电脑双系统引导修复教程
  8. python 公众号文章发布_Python获取公众号文章
  9. 红包小游戏php源码,H5抢红包 小游戏源码
  10. ce标志cad_欧盟CE认证标志大全(完全版)
  11. 几款实用的linux工具
  12. JN5169_EEPROM_PDM
  13. html设置一级标题二级标题格式怎么弄,论文一二三级标题格式如何设置
  14. Storm概念详解和工作原理,topology、spout、bolt的细节和API讲解之一
  15. PHPStudy 安装amqp扩展
  16. 不是技术牛人,如何拿到国内巨头Offer
  17. 微信小程序开发采坑记录1
  18. 投资理财-傻姑娘香草山
  19. 基于爬行动物搜索算法的函数寻优算法
  20. Vue3 学习总结笔记 (十四)

热门文章

  1. 海格里斯仓储冷库知识:自动化大型仓储冷库安装与维修的必要点
  2. 简单的流星背景图 动画效果
  3. 计组 | 浮点数、浮点数补码规格化
  4. 学习记录 - ProxyFactoryBean
  5. C语言个人思考# volatile有什么作用?一个参数可以同时用const和volatile进行修饰吗?
  6. 网易2018实习生招聘笔试题-ios开发实习生(10道)
  7. Python常用数据结构(列表、元组、字典、集合)
  8. Python基于Django的高校作业布置批改管理系统
  9. python爬取餐饮数据_Python爬取附近餐馆信息代码示例
  10. 【单片机】8255A.B.C口输出方波