转自:http://www.csdn.net/article/2013-05-02/2815116-introduce-from-mozilla-heka-go
摘要:一直崇尚开源的Mozilla近日释放了Heka测试版——插件架构,Go编写。在支持使用Go扩展功能的同时,还通过允许“Sandboxed Filters”提供了另一种选择——Lua,同时这种选择下还省去了配置文件的编辑和系统的重启。

近日Mozilla Service团队首次发布了 Heka测试版(v0.2b1),Heka是一款拥有数据收集、分析、监视和报表的工具。其主要组件为 hekad,一个适用于任何主机的轻量级守护程序,其主任务是:

  • 通过读取和解析日志文件收集数据,监视服务器状况,和(或)使用任何协议(syslog、statsd、http、heka等)接收客户端网络连接。
  • 将采集到的数据转换成标准的内部表示,把元数据封装成Heka系统其它组件可以有效处理的形式。
  • 使用一组路由规则评估消息内容和原数据,并为每一个消息分配相应的处理过滤器和外部端点。
  • 飞速地处理消息内容,用以执行聚合、滑窗(sliding-window)事件处理和监控、非结构化数据到结构化数据的形成(举个例子:将日志输入文档解析到数字统计数据或者更加友好的数据结构)并将新的消息以报表的形式输出。
  • 将接收到或者是内部生成的消息数据发送到外部位置:数据可能被写入一个数据库、一个时间序列数据库或者一个网络服务,包括上行的一个hekad实例做更深的处理和(或)聚合。

Heka使用Go语言编写,在α测试中已被证明其非常适合构建数据管道,并让数据管道同时占有快速和灵活两方面的优势;在α测中,一个单hekad实例可以支撑(接收和路由)起每秒10GB的消息数据。Mozilla Service团队借鉴并延伸了 Logstash的想法,将Heka打造成基于插件的系统。开发者可以通过构建定制的Input、Decoder、Filter(比如数据处理)以及Output插件,进行快速和简洁的功能扩展。

所有4个类型的插件都可以用Go来实现,但是管理这些插件需要修改配置文件并重启系统,比如:添加新的插件,甚至是重新编译hekad binary。Heka还通过允许“Sandboxed Filters”提供了另一种选择,这样你就可以使用Lua来代替Go。这样一来,在一个运行中的Heka实例添加或者删除功能就不需要修改配置及重启服务器。Heka同样还提供了一些Lua API,Sandbox Filters可以使用这些API管理时间序列的环形缓冲区,并生成曲线图报告,这些报告将呈现在Heka的仪表盘上:

 
(点击查看大图)

开源相关

Heka是项新的技术,虽然已在Mozilla内部广泛使用,但仍稍显粗糙。就像Mozilla每个产品一样,Heka同样开源。了解更多详情可阅读相关资源:

  • Heka v0.2 binaries
  • Intro to HekaHTML presentation slides
  • Heka project documentation
  • hekad daemon documentation
  • Heka github project
  • Heka-build github project
  • Services devmailing list (for developer support)
  • IRC: #heka channel on irc.mozilla.org
  • Heka python client
  • Heka node.js client

原文链接: Introducing Heka (编译/仲浩 审校/王旭东)

转载于:https://www.cnblogs.com/LCGIS/archive/2013/05/09/3069440.html

Heka:Go编写,来自Mozilla,高效、灵活的插件式数据挖掘工具(转)相关推荐

  1. chatgpt赋能python:Python做仿真模拟:一种高效、灵活、易用的工具

    Python做仿真模拟:一种高效.灵活.易用的工具 介绍 随着计算机技术的不断进步,仿真模拟已成为许多学科研究中不可缺少的工具之一.在许多领域,例如物理.生物.经济等,都需要使用仿真模拟的技术来预测. ...

  2. 来自Mozilla的CSS书写规范建议

    一个来自Mozilla的CSS书写规范建议,希望对大家有帮助 引用内容 //显示属性 display list-style position float clear //自身属性 width heig ...

  3. 富士施乐3065扫描教程_精简高效灵活 富士施乐3065使用测试

    精简高效灵活 富士施乐3065使用测试 2015年11月09日 16:34作者:王琛编辑:王琛文章出处:泡泡网原创 分享 泡泡网黑白复合机评测:对于中小企业用户来说,打印速度.打印成本和功能配置,基本 ...

  4. 使用Qt编写模块化插件式应用程序

    动态链接库技术使软件工程师们兽血沸腾,它使得应用系统(程序)可以以二进制模块的形式灵活地组建起来.比起源码级别的模块化,二进制级别的模块划分使得各模块更加独立,各模块可以分别编译和链接,模块的升级不会 ...

  5. Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器

    Apache Spark 2.4.0是2.x系列中的第五个版本.此版本增加了屏障执行模式,以便更好地与深度学习框架集成:引入30多个更高阶的内置函数,能够更轻松地处理复杂数据类型:优化K8s集成,同时 ...

  6. SPCAMLEditor–灵活实用的CAML编辑工具(上)

    SPCAMLEditor–灵活实用的CAML编辑工具 (上) 查看word版本:SPCAMLEditor_灵活实用的CAML编辑工具1.doc CAML简述 CAML全称Collaborative A ...

  7. [翻译]编写高性能 .NET 代码 第一章:性能测试与工具 -- 平均值 vs 百分比

    平均值 vs 百分比 在考虑要性能测试的目标值时,我们需要考虑用什么统计口径.大多数人都会首选平均值,但在大多数情况下,这个正确的,但你也应该适当的考虑百分数.但你有可用性的要求,作为性能测试的目标里 ...

  8. 天猫php采集列表,QueryList: QueryList是一个基于phpQuery的通用列表采集类,是一个简单、 灵活、强大的采集工具,采集任何复杂的页面 基本上就一句话就能搞定了。...

    #QueryList交流社区: http://querylist.cc/ #QueryList文档: http://doc.querylist.cc/ #QueryList交流QQ群:12326696 ...

  9. fio 全称是flexible I/O tester(灵活的I/O测试工具)。可以根据用户指定I/O类型进行多线程/进程的I/O负载模拟。

    介绍 fio 全称是flexible I/O tester(灵活的I/O测试工具).可以根据用户指定I/O类型进行多线程/进程的I/O负载模拟. 安装部署 fio 是系统ISO自带的基础安装安装包,直 ...

最新文章

  1. 如何配置FastReport.Net环境
  2. 编写高质量JavaScript代码的基本技巧
  3. 以操作系统的角度述说线程与进程
  4. cocos2d-x游戏实例(1)-视角跟随主角
  5. J2EE中下载和安装spring插件
  6. jquery正则表达式验证:验证全是数字
  7. SLS多云日志采集、处理及分析
  8. 13.JAVA基础:八进制,十六进制表示
  9. 阿里矢量图标引入方法
  10. [软件工程] 形式化说明技术
  11. 【VirtualBoxUbuntu】VirtualBox中Ubuntu虚拟机磁盘碎片整理并压缩磁盘空间
  12. 5 款可替代 du 命令的工具
  13. 云更新无盘服务器缓存,云更新无盘服务器缓存设置
  14. 计算机专业笔记本用i5还是i7,玩游戏笔记本i5和i7的区别_笔记本电脑游戏用i5还是i7...
  15. GGDH模型计算浮升力生成项
  16. 高校bbs或者科研论坛
  17. 《裸辞的程序猿漂流记十三》——奔跑在逆袭的路上
  18. 目标检测数据集:坦克(1)
  19. 华为鸿蒙手机曝光,华为鸿蒙手机新特性曝光:充电期间系统将进行深度优化
  20. 移动端excel导出_手机联系人竟可导出到Excel?教你要如何做

热门文章

  1. 『设计模式』小老弟你猜不透我?-- 代理模式
  2. 玩转GIT系列之【git的分支操作(查看分支/切换分支/新建分支/删除分支)】
  3. 如何在ubuntu 12.04系统下开启nfs网络文件系统
  4. 关于真正免费的嵌入式GUI
  5. 神经网络 梯度下降_梯度下降优化器对神经网络训练的影响
  6. 单元测试: gmock
  7. 李嘉诚拥有8500亿资产, 是真正的世界首富,为何要藏富?
  8. 安卓程序开发——创建安卓虚拟机
  9. C++之RAII机制
  10. 网络游戏server编程,第一章笔记