作者 Jonathan Allen ,译者 张晓鹏

Hunk是Splunk公司一款比較新的产品,用来对Hadoop和其他NoSQL数据存储进行探測和可视化,它的新版本号将会支持亚马逊的Elastic MapReduce。

结合Hadoop使用Hunk

Hadoop由两个单元组成。首先是被称为HDFS的存储单元。HDFS能够分布在成千上万个复制的节点上。接下来是MapReduce单元,它负责跟踪和管理被命名为map-reduce jobs的作业。

之前,开发人员会用到Splunk Hadoop Connect (SHC)连接器。SHC通过经常使用的推模型(push model)来输出数据到Hadoop中。这块处理相当地好,但相反方向的处理却可能会有问题。当通过Splunk来探測数据时,原始的数据会被吸收到Splunk Server来检索和处理。就像人们猜想的那样。这个过程并没有发挥出Hadoop计算能力的优势。

Hunk通过提供与Hadoop MapReduce节点协同工作的适配器来解决问题。

Splunk的查询被转化成Hadoop MapReduce的作业,这些作业在Hadoop集群中处理,终于仅仅有结果被取回到Splunk server中进行分析和可视化。

通过这样的方式,Hunk提供了抽象层,以便用户和开发人员不须要关心怎么去写Hadoop MapReduce的作业。

Hunk还能在MapReduce作业启动前就提供结果预览,以降低无用搜索的数量。

结合Elastic MapReduce使用Hunk

亚马逊的Elastic MapReduce能够看做是对Hadoop的补充,同一时候也是Hadoop的竞争者。EMR既能够执行在Hadoop HDFS集群上,也能够直接执行在AWS S3上。亚马逊宣称使用AWS S3的优势在于比HDFS集群更易于管理。

当执行Elastic MapReduce时。Hunk提供了同样的抽象层和预览功能,就像它在Hadoop上做的一样。

所以从用户的观点来看,在Hadoop和EMR之间切换不会造成什么变化。

云上的Hunk

在云上托管Hunk的传统方法是买一个标准版的许可证。然后部署到虚拟机中,这和你现场安装一样简单。

接下来是

转载于:https://www.cnblogs.com/zhchoutai/p/7382152.html

大数据分析:结合 Hadoop或 Elastic MapReduce使用 Hunk相关推荐

  1. 《Spark与Hadoop大数据分析》一一1.1 大数据分析以及 Hadoop 和 Spark 在其中承担的角色...

    本节书摘来自华章计算机<Spark与Hadoop大数据分析>一书中的第1章,第1.1节,作者:文卡特·安卡姆(Venkat Ankam) 更多章节内容可以访问云栖社区"华章计算机 ...

  2. 大数据分析之Hadoop

    一.目标: 1.完成Hadoop的部署和配置 2.正常启动/关闭Hadoop集群,并完成基准测试 3.理解分布式文件系统的设计思想 4.熟练操作Hadoop集群 二.Hadoop的安装与部署 一.切换 ...

  3. 【大数据分析之Hadoop】一、Hadoop基本原理

    一.hadoop概念 Hadoop由两部分组成,一是负责存储与管理文件的分布式文件系统HDFS.二是负责处理与计算的MapReduce的计算框架. 二.HDFS 1.namenode 负责管理工作(管 ...

  4. 每周一书《Spark与Hadoop大数据分析》分享!

    Spark与Hadoop大数据分析比较系统地讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,既涵盖ApacheSpark和Hadoop的基础知识,又深入探讨所有Spa ...

  5. 2020十大最佳大数据分析工具,果断收藏

    作者:Sunita Chauhan 转自:InfoQ https://www.infoq.cn/article/IEIa8zX2s0KpLYi34ocE 营销的基本原理是一致的,每个人都喜欢洞察力,因 ...

  6. qtablewidget 数据量大效率很低_让大牛带你走进大数据分析:R基础及应用的潮流尖端,享受RHadoop...

    走进R,走进大数据时代数据分析的潮流尖端,掌握R语言,熟悉大数据的基础概念和R与Hadoop结合进行大数据的处理分析. 大数据时代, R以其强大的数据分析挖掘.可视化绘图等功能,越来越受到社会各个领域 ...

  7. SaaSBase:推荐七款超好用的大数据分析工具

    如今,大小企业都可以利用商业智能工具来理解复杂的大数据.通过收集和分析这些数据,并将其转化成易于理解的报告,这些解决方案可以为企业提供有价值的洞察力,从而提高企业利润.SaaSBase(saasbas ...

  8. 《R与Hadoop大数据分析实战》一1.6 HDFS和MapReduce架构

    本节书摘来自华章出版社<R与Hadoop大数据分析实战>一书中的第1章,第1.6节,作者 (印)Vignesh Prajapati,更多章节内容可以访问云栖社区"华章计算机&qu ...

  9. 使用Hadoop MapReduce进行大数据分析

    Google在2001年推出图片搜索功能时,拥有2.5亿张索引图片. 不到十年后,这家搜索巨头就索引了超过100亿张图片. 每分钟有35个小时的内容上传到YouTube. 据说Twitter平均每天处 ...

最新文章

  1. python subprocess_python subprocess
  2. 浅谈GCC预编译头技术
  3. 一口一个,超灵活的Python迷你项目
  4. 5G产业发展最新进展深度解析(144页PPT)
  5. DataBinding 学习系列(2)详解DataBinding在xml中的使用
  6. jasmine.any(Function)
  7. python可迭代对象 迭代器生成器_Python可迭代对象、迭代器和生成器
  8. dfa转正则表达式_从0到1打造正则表达式执行引擎(二)
  9. arcengine遍历属性表_Excel催化剂-遍历文件夹内文件信息特别是图像、音视频等特有信息...
  10. python遇到的问题-Python常见问题
  11. python自动聊天机器人_Python实现微信聊天机器人
  12. [项目管理]-第十二章:项目监督和控制
  13. 容量 Byte、KB、MB、GB、TB、PB、EB、ZB、YB、NB、DB、CB、XB
  14. COM笔记-Widows 注册表
  15. 瘦客户端那些事 - 开篇
  16. Linux就这个范儿 第13章 打通任督二脉
  17. c语言程序设计创新课程,C语言程序设计课程创新和实践.doc
  18. Tableau收购慕尼黑工业大学(TUM)开发的高性能数据库系统HyPer
  19. js生成随机数字符串
  20. Manjaro安装配置美化字体模糊发虚解决记录

热门文章

  1. JavaScript 实例:当当网 首页选项卡切换效果
  2. kali安装teamviewer
  3. 如何用项目管理软件,帮助项目经理监控项目进度?
  4. linux终端护眼色参数,四个 Linux 下的“护眼”软件解析
  5. 1504: 变态杀人狂 时间限制: 1 Sec 内存限制: 128 MB 提交: 21 解决: 10 [提交][状态][论坛] 题目描述 变态杀人狂三师弟想到一个杀人游戏 游戏规则如下: 三师
  6. 新版仿微信支付生活缴费小程序源码+UniAPP内核
  7. ubuntu 18.04 在线 升级 到 20.04 后一些善后工作,相同的快捷方式或快捷方式占用
  8. 拒绝访问html,为什么IE常常出现拒绝访问 ie拒绝访问的原因及解决方法
  9. 开源中国源码学习UI篇(二)之NavigationDrawer+Fragment的使用分析
  10. 计算机桌面打开图像管理,​电脑屏幕出现:图像设定自动设定,屏幕优化中请稍等...怎么解决?...