Hadoop是开源的,但是企业版本其实是由几家大的公司把持,这个就类似linux的redhat和suse一样,提供hadoop发型版本的公司主要的有Hortonworks,Cloudera,mapR。

今天简单介绍Hortonworks:

先了解下Hortonworks的起源,Hortonworks公司,由Yahoo和Benchmark Capital于2011年7月联合创建,出身于名门Yahoo,Hortonworks拥有着许多Hadoop架 构师和源代码贡献者,这些源代码贡献者以前均效力于Yahoo,而且已经为Apache Hadoop项目贡献了超过80%的源代码。

Hortonworks的发版本框架如下:

简单介绍几个业界用得比较多的组件:

Apache Hive:Hive 基于 MapReduce 而构建,是一种数据仓库,通过用于存储在 HDFS 中的大型数据集的类 SQL 接口实现便利的数据汇总和临时查询。

Apache Mahout:Mahout 为 Hadoop 提供可扩展机器学习算法,帮助数据科技实现基于群集、分类和批处理的协作性筛选。

Apache HBase:一种面向列的 NoSQL 数据存储系统,为用户应用程序提供对于大数据的随机实时读/写访问权限。

Apache Storm:Storm 是一种分布式实时计算系统,用于处理快速、大型的数据流,为 Apache Hadoop® 2.x 带来可靠的实时数据处理功能

Apache Ambari:用于 Apache Hadoop 群集的一种开源安装生命周期管理、营运和监控系统。

Apache Oozie:Oozie Java Web 应用程序用于计划 Apache Hadoop 作业。Oozie 按顺序将多个作业组合至一个逻辑工作单位。

其他更详细的资料可以访问官网:http://zh.hortonworks.com/hadoop/。

关于hadoop开源软件,大家要有以下认识:

  1. 开源并不等于免费,这些发行版公司通过收取服务费的方式赚钱。
  2. 开源软件,如果是企业级应用,自身没有足够的研发能力的话,还是要尽量选用发型版本,以获得技术支持。
  3. 开源软件往往不能满足需求,二次集成,二次开发的能力很重要,但凡有一定技术能力的公司应该立足在用的基础上,应该发展和锻炼自己的技术团队。
  4. 业界还有很多公司也给hadoop贡献源码,但是并不发行企业版本。国内如阿里巴巴,华为等等,这些公司贡献源码,主要是要使自己的代码能合入开源主干,这样修改的代码可以得到开源社区的力量继续发展。如果开发的东西不能合入开源主干的话,一两年之后就落后于开源社区。

hadoop发行商介绍:Hortonworks相关推荐

  1. Hadoop入门扫盲:hadoop发行版介绍与选择

    一.hadoop发行版介绍 目前Hadoop发行版非常多,有Intel发行版,华为发行版.Cloudera发行版(CDH).Hortonworks版本等,所有这些发行版均是基于Apache Hadoo ...

  2. av发行商_如何向发行商推销游戏

    av发行商 Later this week, Gamesindustry.biz will present its annual Investment Summit Online event, bri ...

  3. 小米fortnite_“ Fortnite”发行商Epic Games希望从内部改变App Store业务 杂色的傻瓜...

    小米fortnite Epic Games wants to change the app store business from within. Earlier this week, the com ...

  4. 因地制宜,携手共赢 | 亚太地区游戏发行商洞察

    对于游戏从业者来说,游戏发行模式并不是一个新概念.但是,由于相关政策不断变化并趋于复杂.用户对本地化内容的期望不断提高,以及外部环境日渐纷扰 (例如疫情导致出游人数减少),移动游戏发行商变得越来越重要 ...

  5. 学习笔记Hadoop(八)—— Hadoop集群的安装与部署(5)—— Hadoop配置参数介绍、Hadoop集群启动与监控

    五.Hadoop配置参数介绍 Hadoop集群配置文件主要有: 它们的默认参数配置可以看: core-default.xml :https://hadoop.apache.org/docs/stabl ...

  6. 什么是HADOOP、产生背景、在大数据、云计算中的位置和关系、国内外HADOOP应用案例介绍、就业方向、生态圈以及各组成部分的简介(学习资料中的文档材料)

    1. HADOOP背景介绍 1. 1.1 什么是HADOOP 1.        HADOOP是apache旗下的一套开源软件平台 2.        HADOOP提供的功能:利用服务器集群,根据用户 ...

  7. tdd测试驱动开发课程介绍_测试驱动开发的实用介绍

    tdd测试驱动开发课程介绍 by Luca Piccinelli 通过卢卡·皮奇内利 测试驱动开发很难! 这是不为人知的事实. (Test Driven Development is hard! Th ...

  8. 2018年度全球收入52强App发行商榜单公布:腾讯连续三年居首

    [TechWeb]2月25日消息,App Annie今天公布了2018年度全球收入52强App发行商榜单,中国共有11 家公司入围,腾讯连续三年稳居榜首. 与往年一样,亚太地区的发行商再次统治了年度榜 ...

  9. Hadoop常用命令介绍

    下面分享一篇 常用的Hadoop命令介绍,希望对Hadoop初学者的朋友有所帮助~ Hadoop常用命令介绍

最新文章

  1. Lync Server 2010迁移至Lync Server 2013部署系列 Part2:部署后端主服务器
  2. Failed to install DroidIPCam.apk on device 'emulator-5554': timeout
  3. c++TCP的三次握手和四次挥手
  4. 算法导论之python实现插入排序
  5. freemarker小例子
  6. spark on yarn 完全分布式_「大数据」(七十一)Spark之架构介绍
  7. 基于Java+jsp+servlet的养老院管理系统设计和实现《收藏版》
  8. 浏览器地址栏传中文乱码
  9. 安装net framework2.0,装不上怎么办?
  10. phpstudy环境下安装部署moodle平台
  11. magento -- 添加中国省份列表
  12. Ubuntu 20.04 配置VNC远程桌面访问
  13. CDMA(Code Division Multiple Access码分多址)
  14. 大厂的区块链之路|蚂蚁金服怎么玩?
  15. 面试题之10亿正整数问题--完整解答
  16. 三星s8html查看器,拆解三星S8手机
  17. vue3.0 watch监听器使用方法
  18. 笔记:戴蒙德模型——参数变化的影响
  19. java 复制excel_Java 复制excel批注
  20. 利用百度地图sdk实现定位

热门文章

  1. 安卓模拟器登录微信自动化测试最佳实践
  2. 世界弹射物语 模拟抽卡
  3. Java面向对象-01-类和对象
  4. EXCEL转PDF,JACOB,生成checkbox
  5. js获取一段时间内工作日的天数
  6. 2022年秋,工程伦理期末考试答案(仅供参考)
  7. c语言 获取 屏幕 像素坐标和颜色,在屏幕上获取颜色和绝对坐标,方便地选择像素...
  8. 评论中发emoji表情 iOS
  9. css实现元素翻转(不是旋转)
  10. 线性结构-前缀和和差分