hadoop发行商介绍:Hortonworks
Hadoop是开源的,但是企业版本其实是由几家大的公司把持,这个就类似linux的redhat和suse一样,提供hadoop发型版本的公司主要的有Hortonworks,Cloudera,mapR。
今天简单介绍Hortonworks:
先了解下Hortonworks的起源,Hortonworks公司,由Yahoo和Benchmark Capital于2011年7月联合创建,出身于名门Yahoo,Hortonworks拥有着许多Hadoop架 构师和源代码贡献者,这些源代码贡献者以前均效力于Yahoo,而且已经为Apache Hadoop项目贡献了超过80%的源代码。
Hortonworks的发版本框架如下:
简单介绍几个业界用得比较多的组件:
Apache Hive:Hive 基于 MapReduce 而构建,是一种数据仓库,通过用于存储在 HDFS 中的大型数据集的类 SQL 接口实现便利的数据汇总和临时查询。
Apache Mahout:Mahout 为 Hadoop 提供可扩展机器学习算法,帮助数据科技实现基于群集、分类和批处理的协作性筛选。
Apache HBase:一种面向列的 NoSQL 数据存储系统,为用户应用程序提供对于大数据的随机实时读/写访问权限。
Apache Storm:Storm 是一种分布式实时计算系统,用于处理快速、大型的数据流,为 Apache Hadoop® 2.x 带来可靠的实时数据处理功能
Apache Ambari:用于 Apache Hadoop 群集的一种开源安装生命周期管理、营运和监控系统。
Apache Oozie:Oozie Java Web 应用程序用于计划 Apache Hadoop 作业。Oozie 按顺序将多个作业组合至一个逻辑工作单位。
其他更详细的资料可以访问官网:http://zh.hortonworks.com/hadoop/。
关于hadoop开源软件,大家要有以下认识:
- 开源并不等于免费,这些发行版公司通过收取服务费的方式赚钱。
- 开源软件,如果是企业级应用,自身没有足够的研发能力的话,还是要尽量选用发型版本,以获得技术支持。
- 开源软件往往不能满足需求,二次集成,二次开发的能力很重要,但凡有一定技术能力的公司应该立足在用的基础上,应该发展和锻炼自己的技术团队。
- 业界还有很多公司也给hadoop贡献源码,但是并不发行企业版本。国内如阿里巴巴,华为等等,这些公司贡献源码,主要是要使自己的代码能合入开源主干,这样修改的代码可以得到开源社区的力量继续发展。如果开发的东西不能合入开源主干的话,一两年之后就落后于开源社区。
hadoop发行商介绍:Hortonworks相关推荐
- Hadoop入门扫盲:hadoop发行版介绍与选择
一.hadoop发行版介绍 目前Hadoop发行版非常多,有Intel发行版,华为发行版.Cloudera发行版(CDH).Hortonworks版本等,所有这些发行版均是基于Apache Hadoo ...
- av发行商_如何向发行商推销游戏
av发行商 Later this week, Gamesindustry.biz will present its annual Investment Summit Online event, bri ...
- 小米fortnite_“ Fortnite”发行商Epic Games希望从内部改变App Store业务 杂色的傻瓜...
小米fortnite Epic Games wants to change the app store business from within. Earlier this week, the com ...
- 因地制宜,携手共赢 | 亚太地区游戏发行商洞察
对于游戏从业者来说,游戏发行模式并不是一个新概念.但是,由于相关政策不断变化并趋于复杂.用户对本地化内容的期望不断提高,以及外部环境日渐纷扰 (例如疫情导致出游人数减少),移动游戏发行商变得越来越重要 ...
- 学习笔记Hadoop(八)—— Hadoop集群的安装与部署(5)—— Hadoop配置参数介绍、Hadoop集群启动与监控
五.Hadoop配置参数介绍 Hadoop集群配置文件主要有: 它们的默认参数配置可以看: core-default.xml :https://hadoop.apache.org/docs/stabl ...
- 什么是HADOOP、产生背景、在大数据、云计算中的位置和关系、国内外HADOOP应用案例介绍、就业方向、生态圈以及各组成部分的简介(学习资料中的文档材料)
1. HADOOP背景介绍 1. 1.1 什么是HADOOP 1. HADOOP是apache旗下的一套开源软件平台 2. HADOOP提供的功能:利用服务器集群,根据用户 ...
- tdd测试驱动开发课程介绍_测试驱动开发的实用介绍
tdd测试驱动开发课程介绍 by Luca Piccinelli 通过卢卡·皮奇内利 测试驱动开发很难! 这是不为人知的事实. (Test Driven Development is hard! Th ...
- 2018年度全球收入52强App发行商榜单公布:腾讯连续三年居首
[TechWeb]2月25日消息,App Annie今天公布了2018年度全球收入52强App发行商榜单,中国共有11 家公司入围,腾讯连续三年稳居榜首. 与往年一样,亚太地区的发行商再次统治了年度榜 ...
- Hadoop常用命令介绍
下面分享一篇 常用的Hadoop命令介绍,希望对Hadoop初学者的朋友有所帮助~ Hadoop常用命令介绍
最新文章
- Lync Server 2010迁移至Lync Server 2013部署系列 Part2:部署后端主服务器
- Failed to install DroidIPCam.apk on device 'emulator-5554': timeout
- c++TCP的三次握手和四次挥手
- 算法导论之python实现插入排序
- freemarker小例子
- spark on yarn 完全分布式_「大数据」(七十一)Spark之架构介绍
- 基于Java+jsp+servlet的养老院管理系统设计和实现《收藏版》
- 浏览器地址栏传中文乱码
- 安装net framework2.0,装不上怎么办?
- phpstudy环境下安装部署moodle平台
- magento -- 添加中国省份列表
- Ubuntu 20.04 配置VNC远程桌面访问
- CDMA(Code Division Multiple Access码分多址)
- 大厂的区块链之路|蚂蚁金服怎么玩?
- 面试题之10亿正整数问题--完整解答
- 三星s8html查看器,拆解三星S8手机
- vue3.0 watch监听器使用方法
- 笔记:戴蒙德模型——参数变化的影响
- java 复制excel_Java 复制excel批注
- 利用百度地图sdk实现定位