This Article Is From :https://examples.javacodegeeks.com/enterprise-java/apache-hadoop/prerequisites-learning-hadoop/

建议先看英文再看翻译:翻译使用的是Google翻译。

关于作者:Ramaninder毕业于德国Georg-August大学计算机科学与数学系,目前与奥地利的大数据研究中心合作。他拥有应用计算机科学硕士学位,专业应用系统工程和商业信息学。 他也是一名微软认证过程,在Java,C#,Web开发和相关技术方面有超过5年的经验。目前,他的主要兴趣是大数据生态系统,包括批处理和流处理系统,机器学习和Web应用程序。

在本文中,我们将深入了解什么是学习和使用Hadoop的先决条件。在开始学习Hadoop之前,我们将看到什么是需要的东西,什么是行业标准建议的事情。

1.介绍

Apache Hadoop是入门点,或者我们可以说是进入整个大数据生态系统的基础。它是大数据生态系统中大多数高级工具,应用程序和框架的基础,但是在学习Apache Hadoop时,还需要事先知道一些事情。

开始学习Apache Hadoop没有严格的先决条件。 但是,它使事情更容易,如果你想成为和Apache Hadoop的专家,这些是很好的知道的东西。

因此,Apache Hadoop的两个非常基本的先决条件是:

  1. Java
  2. Linux
  3. SQL

我们将在下面的章节中介绍这些。

2.Java

知道Java不是使用Hadoop的严格先决条件,但是知道它显然是深入了解Apache Hadoop工作的额外优势。

这可能听起来很奇怪,我提到的第一个先决条件是Java和我保存这也不是严格的先决条件,但添加。好吧,让我们看看为什么这样。

有一些工具和应用程序,例如Pig,Hive等,它们构建在Hadoop之上。这些工具提供自己的高级交互语言,用于处理在Apache Hadoop集群上存储和处理的数据。例如,Pig Latin用于Pig,HiveQL用于Hive。因此,对于不想深入编写复杂的MapReduce应用程序但希望使用Hive或Pig与集群中的数据进行交互的人,可以跳过Java。

对于编写Hadoop MapReduce应用程序,Java也不是唯一的选择。Hadoop提供了一个选项,可以使用任何可以从标准输入读取的语言,并且可以使用称为Hadoop Streaming的组件写入标准输出以编写MapReduce程序。例如,Python,Ruby,C等。但是由于Apache Hadoop是用Java编写的,为了使组件尽可能接近,Java是一种语言。Pig Latin和HiveQL命令也在内部转换为Java MapReduce程序并执行。

所以,如果你想知道Apache Hadoop的坚果和螺栓,如果需求变得越来越复杂,Java是Apache Hadoop的先决条件。

注意:要了解有关Hadoop MapReduce,Hadoop Streaming和Hive的基础知识的更多信息,请按照以下文章:

  • Apache Hadoop WordCount Example
  • Hadoop Streaming Example
  • Apache Hadoop Hive Tutorial


但是,当我们有Hadoop Steaming时,为什么要使用Java
确实Hadoop Steaming提供了使用许多语言编写MapReduce程序的选项,但是目前只有Java API在Apache Hadoop中有一些优点和优点。

因此,Java不是学习Hadoop的严格先决条件,但是被行业用例强烈推荐。

3.Linux

虽然Apache Hadoop可以在Windows上运行,但它最初是在Linux上构建的。Linux是安装和管理Hadoop集群的首选方法。 因此,了解Linux的工作和使用也有很多帮助。

当从命令行管理Hadoop分布式文件系统(HDFS)时,许多命令与Linus shell命令类似或完全相同。 要了解HDFS和HDFS shell命令,请参阅文章:

  • Apache Hadoop Distributed File System Explained
  • Apache Hadoop FS Commands Example

除此之外,我们还需要知道linux,如果我们想要部署和配置Hadoop集群甚至单节点机器。

4.SQL

对于已经熟悉SQL的人,他们可以利用他们现有的知识。 他们可以在Hive之上学习和使用SQL语法。 Apache Hive查询语言几乎类似于ANSI SQL。 除了Hive,Apache Pig还有很多类似于SQL命令的命令。例如,连接,分组,顺序等。不仅Apache Hadoop,而且其他大数据生态系统工具也提供类似SQL的接口,以便用户更容易地学习已经熟悉SQL的工具。Cassandra和HBase是一些工具,它们提供类似于查询接口的SQL,用于与数据交互。

5.总结

正如所讨论的,开始学习Apache Hadoop没有严格的先决条件,但在挖掘Apache Hadoop深入之前,我们应该熟悉一些事情。然后,我们一次讨论了这些先决条件,以了解它们在哪里和如何使用以及我们将需要它。 在我们深入Apache Hadoop之前,了解一些或所有这些先决条件将是很好的。

学习Hadoop的前提条件相关推荐

  1. 集成学习算法的思想、通过集成学习提高整体泛化能力的前提条件、如何得到独立的分类器Bagging、Boosting、Stacking算法

    集成学习算法 Ensemble learning algorithm 目的:让机器学习的效果更好,单个的分类器如果表现的好,那么能不能通过使用多个分类器使得分类效果更好呢?或者如果单个分类器分类效果不 ...

  2. nginx学习——建立hash表的前提条件

    在前面两篇博文中分别介绍了nginx中普通hash表和带有通配符的hash表的建立和查找,今天主要是介绍建立hash表的前提条件,并在后面附上一个完整的hash表的实现(该部分代码为转载). 一.建立 ...

  3. comparator 多个条件控制_JUnit5学习之四:按条件执行

    欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类和汇总,及配套源码,涉及Java.Docker.Kubernetes.DevO ...

  4. 浅谈:OA软件实施推广的前提条件和策略

    单位/企业/组织通过OA软件需求规划.选择.开发和测试,正式进入实施推广阶段,这是最后一个关键环节,这个环节决定了OA软件实施能否广泛应用于企事业单位的全体人员中.OA软件实施推广不是一个简单的技术问 ...

  5. JUnit5学习之四:按条件执行

    欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 关于<JUnit5学习>系列 <JU ...

  6. 互联网+和创业潮,互联网+前提条件是什么?互联网+做什么?

    在大众创业,万众创新的大浪下,凭着对新技术的敏感和青春激情,创业新军不断涌现....  互联网+创业浪潮, 如雨后春笋......,互联网+渗透每个人的心中. 创业不是赶时髦,而是一条非常孤独,艰难的 ...

  7. Exchange2010各角色对软件环境的前提条件

        最近一直在弄Exchange2010的测试,先是beta,后来又是RC,刚刚又在MSDN拿到了RTM..POC算是完了一大半,后续还有一些分布式.高可用方面的测试.. 近两天看到不少朋友也打算 ...

  8. Dataguard配置前提条件

    Data Guard配置前提条件 配置Data Guard必须保证以下前提条件: 1.Data Guard是Oracle企业版的组件.Oracle标准版里没有这个控件.所以Data Guard配置所使 ...

  9. 从零开始学习hadoop之发行版选择

    从零开始学习hadoop之发行版选择 经常会看到这样的问题:零基础学习hadoop难不难?有的人回答说:零基础学习hadoop,没有想象的那么难,也没有想象的那么容易.看到这样的答案不免觉得有些尴尬, ...

最新文章

  1. Djiango模板语言DTL
  2. 高金吉院士:让机器“自愈化”引领新科技变革
  3. 使用Ant实现打包jar包上传到服务器
  4. PYTHON的主模块
  5. Kubernetes 凭什么成了云原生应用底座?
  6. linux update语句,关于Update语句的调整(5-1)
  7. 小型移动 webApp Demo 知识点整理
  8. 微信公众号开发 重要 access_token {errcode:40164,errmsg:invalid ip 114.221.159.11, not in whitelist hint:
  9. python中解决死锁的方法
  10. python函数示例_带Python示例的float()函数
  11. django通过ajax请求接口返回多条数据,并动态生成表格,请求表单后将表格数据并入库
  12. HTTP基础--chapter2结束了
  13. 分享一下最近看的东西
  14. Linux系统下apt-get命令详解
  15. 力扣-88 合并两个有序数组
  16. 人类能看懂的衍射光学(含基尔霍夫衍射,瑞利--索末菲衍射,夫琅禾费衍射,角谱衍射,菲涅尔衍射积分,菲涅尔衍射的S-FFT算法,T-FFT算法,D-FFT算法)
  17. 访问php页面显示源码解决方法
  18. 论文阅读——Don‘t Stop Pretraining: Adapt Language Models to Domains and Tasks
  19. 比较全的Struts介绍04
  20. 老照片变模糊 10种方法将照片处理清晰

热门文章

  1. 关于剪枝对象的分类(weights剪枝、神经元剪枝、filters剪枝、layers剪枝、channel剪枝、对channel分组剪枝、Stripe剪枝)
  2. Serializable的含义
  3. 协方差,协方差矩阵,相关系数
  4. 【计组】原码的一位乘法运算
  5. ABP官方文档(十三)【对象之间的映射】
  6. 开启xmp1还是2_在DLSS2.0技术的加持下,游戏开启光线追踪的硬件需求是否会大大降低?...
  7. 盲签名——典型的数字签名技术
  8. 性能测试时那些「难以启齿」的问题-CPU相关
  9. Android Menu 之 ContextMenu 详解
  10. Python实现BT种子转化为磁力链接【实战】