This Article Is From :https://examples.javacodegeeks.com/enterprise-java/apache-hadoop/prerequisites-learning-hadoop/

建议先看英文再看翻译:翻译使用的是Google翻译。

关于作者:Ramaninder毕业于德国Georg-August大学计算机科学与数学系,目前与奥地利的大数据研究中心合作。他拥有应用计算机科学硕士学位,专业应用系统工程和商业信息学。 他也是一名微软认证过程,在Java,C#,Web开发和相关技术方面有超过5年的经验。目前,他的主要兴趣是大数据生态系统,包括批处理和流处理系统,机器学习和Web应用程序。

在本文中,我们将深入了解什么是学习和使用Hadoop的先决条件。在开始学习Hadoop之前,我们将看到什么是需要的东西,什么是行业标准建议的事情。

1.介绍

Apache Hadoop是入门点,或者我们可以说是进入整个大数据生态系统的基础。它是大数据生态系统中大多数高级工具,应用程序和框架的基础,但是在学习Apache Hadoop时,还需要事先知道一些事情。

开始学习Apache Hadoop没有严格的先决条件。 但是,它使事情更容易,如果你想成为和Apache Hadoop的专家,这些是很好的知道的东西。

因此,Apache Hadoop的两个非常基本的先决条件是:

  1. Java
  2. Linux
  3. SQL

我们将在下面的章节中介绍这些。

2.Java

知道Java不是使用Hadoop的严格先决条件,但是知道它显然是深入了解Apache Hadoop工作的额外优势。

这可能听起来很奇怪,我提到的第一个先决条件是Java和我保存这也不是严格的先决条件,但添加。好吧,让我们看看为什么这样。

有一些工具和应用程序,例如Pig,Hive等,它们构建在Hadoop之上。这些工具提供自己的高级交互语言,用于处理在Apache Hadoop集群上存储和处理的数据。例如,Pig Latin用于Pig,HiveQL用于Hive。因此,对于不想深入编写复杂的MapReduce应用程序但希望使用Hive或Pig与集群中的数据进行交互的人,可以跳过Java。

对于编写Hadoop MapReduce应用程序,Java也不是唯一的选择。Hadoop提供了一个选项,可以使用任何可以从标准输入读取的语言,并且可以使用称为Hadoop Streaming的组件写入标准输出以编写MapReduce程序。例如,Python,Ruby,C等。但是由于Apache Hadoop是用Java编写的,为了使组件尽可能接近,Java是一种语言。Pig Latin和HiveQL命令也在内部转换为Java MapReduce程序并执行。

所以,如果你想知道Apache Hadoop的坚果和螺栓,如果需求变得越来越复杂,Java是Apache Hadoop的先决条件。

注意:要了解有关Hadoop MapReduce,Hadoop Streaming和Hive的基础知识的更多信息,请按照以下文章:

  • Apache Hadoop WordCount Example
  • Hadoop Streaming Example
  • Apache Hadoop Hive Tutorial


但是,当我们有Hadoop Steaming时,为什么要使用Java
确实Hadoop Steaming提供了使用许多语言编写MapReduce程序的选项,但是目前只有Java API在Apache Hadoop中有一些优点和优点。

因此,Java不是学习Hadoop的严格先决条件,但是被行业用例强烈推荐。

3.Linux

虽然Apache Hadoop可以在Windows上运行,但它最初是在Linux上构建的。Linux是安装和管理Hadoop集群的首选方法。 因此,了解Linux的工作和使用也有很多帮助。

当从命令行管理Hadoop分布式文件系统(HDFS)时,许多命令与Linus shell命令类似或完全相同。 要了解HDFS和HDFS shell命令,请参阅文章:

  • Apache Hadoop Distributed File System Explained
  • Apache Hadoop FS Commands Example

除此之外,我们还需要知道linux,如果我们想要部署和配置Hadoop集群甚至单节点机器。

4.SQL

对于已经熟悉SQL的人,他们可以利用他们现有的知识。 他们可以在Hive之上学习和使用SQL语法。 Apache Hive查询语言几乎类似于ANSI SQL。 除了Hive,Apache Pig还有很多类似于SQL命令的命令。例如,连接,分组,顺序等。不仅Apache Hadoop,而且其他大数据生态系统工具也提供类似SQL的接口,以便用户更容易地学习已经熟悉SQL的工具。Cassandra和HBase是一些工具,它们提供类似于查询接口的SQL,用于与数据交互。

5.总结

正如所讨论的,开始学习Apache Hadoop没有严格的先决条件,但在挖掘Apache Hadoop深入之前,我们应该熟悉一些事情。然后,我们一次讨论了这些先决条件,以了解它们在哪里和如何使用以及我们将需要它。 在我们深入Apache Hadoop之前,了解一些或所有这些先决条件将是很好的。

学习Hadoop的前提条件相关推荐

  1. 集成学习算法的思想、通过集成学习提高整体泛化能力的前提条件、如何得到独立的分类器Bagging、Boosting、Stacking算法

    集成学习算法 Ensemble learning algorithm 目的:让机器学习的效果更好,单个的分类器如果表现的好,那么能不能通过使用多个分类器使得分类效果更好呢?或者如果单个分类器分类效果不 ...

  2. nginx学习——建立hash表的前提条件

    在前面两篇博文中分别介绍了nginx中普通hash表和带有通配符的hash表的建立和查找,今天主要是介绍建立hash表的前提条件,并在后面附上一个完整的hash表的实现(该部分代码为转载). 一.建立 ...

  3. comparator 多个条件控制_JUnit5学习之四:按条件执行

    欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类和汇总,及配套源码,涉及Java.Docker.Kubernetes.DevO ...

  4. 浅谈:OA软件实施推广的前提条件和策略

    单位/企业/组织通过OA软件需求规划.选择.开发和测试,正式进入实施推广阶段,这是最后一个关键环节,这个环节决定了OA软件实施能否广泛应用于企事业单位的全体人员中.OA软件实施推广不是一个简单的技术问 ...

  5. JUnit5学习之四:按条件执行

    欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 关于<JUnit5学习>系列 <JU ...

  6. 互联网+和创业潮,互联网+前提条件是什么?互联网+做什么?

    在大众创业,万众创新的大浪下,凭着对新技术的敏感和青春激情,创业新军不断涌现....  互联网+创业浪潮, 如雨后春笋......,互联网+渗透每个人的心中. 创业不是赶时髦,而是一条非常孤独,艰难的 ...

  7. Exchange2010各角色对软件环境的前提条件

        最近一直在弄Exchange2010的测试,先是beta,后来又是RC,刚刚又在MSDN拿到了RTM..POC算是完了一大半,后续还有一些分布式.高可用方面的测试.. 近两天看到不少朋友也打算 ...

  8. Dataguard配置前提条件

    Data Guard配置前提条件 配置Data Guard必须保证以下前提条件: 1.Data Guard是Oracle企业版的组件.Oracle标准版里没有这个控件.所以Data Guard配置所使 ...

  9. 从零开始学习hadoop之发行版选择

    从零开始学习hadoop之发行版选择 经常会看到这样的问题:零基础学习hadoop难不难?有的人回答说:零基础学习hadoop,没有想象的那么难,也没有想象的那么容易.看到这样的答案不免觉得有些尴尬, ...

最新文章

  1. 中秋将至,联合几个号主送出价值500元的中秋大礼包
  2. mybatis实现批量更新
  3. 企业跟风移动考勤市场,变革下的移动考勤应该怎么玩?
  4. 经典递归——斐波那契数列,汉诺塔
  5. 洛谷P1144-最短路计算【日常最短路,日常图论,SPFA】
  6. 【机器视觉】 dev_map_var算子
  7. python中的装饰器和抽象类
  8. python变量设置为true_如果为true,则从现在起在Python中忽略变量
  9. 蚂蚁集团回应两地暂缓上市;​iPhone 有望采用侧面指纹识别;Pyston v2 发布|极客头条
  10. php 双向队列,php实现的双向队列类实例
  11. csv文件的读写-列表,字典方式
  12. H5网页等链接被微信秒封(拦截、屏蔽、和谐)后最好的解决方法
  13. 线报采集监控|人工智能+线报采集算法+大数据过滤无效线报
  14. Linux 添加网卡
  15. ios直播开发基础,推流协议及流程
  16. Unity 程序升级(PC版非热更新)
  17. 微信JSAPI支付实现
  18. 搜索包含关键字的文本
  19. 我敢说80% 的程序员都掉进了「老鼠赛跑」的陷阱
  20. Java算法大全_java贪心算法几个经典例子

热门文章

  1. 设计模式---组合Composite模式
  2. macOS安装brew和使用brew
  3. cv2-特征点匹配(bf、FLANN)
  4. 星巴克REST案例分析(转载自InfoQ)
  5. html clear属性值,clear属性怎么用
  6. Nextchip系列芯片资料收集----RX/ISP/AHD使用场景
  7. RTX3060是什么级别显卡 RTX3060显卡什么水平
  8. wangEditor图片上传
  9. android 经纬度工具类,工具类之LocationUtils(定位工具类)
  10. 太平洋电信分享如何“构建敏捷网络,共筑网络安全防护带”