Hadoop是一个由Apache基金会所开发的分布式系统基础架构,他从0.x版本到现在的3.0版本,经历了各种变化。但是变化中有不变的是他的主要功能就是Hdfs(分布式文件存储) ,Mapreduce(分布式并行计算框架)。

其中,Hdfs主要是用来进行文件的存储,他涉及文件存储不同压缩方式,文件存储在各个节点是否均衡等。

Mapreduce用来并行计算数据,他通过简单的Mapper,combine,parttion,reducer的过程对批量的数据进行了格式化,排序等处理,他涉及mapper个数,重写combine,partition,reducer的个数等。

我们要对Hadoop有个初步的认识,才能为我们进一步研究别的大数据框架做好准备。

在这里相信有许多想要学习大数据的同学,大家可以+下大数据学习裙:957205962,即可免费领取套系统的大数据学习教程  

先谈一下如何才能进行hadoop入门——

  • 学会一门语言最好学习java,因为hadoop框架大部分是java编写的。然后可以深入了解一下java NIO,多线程编程,jvm的原理等。

  • 系统层面学会使用linux的基本shell命令,比如vi、cat、grep、scp等,因为你学习hadoop得首先会安装hadoop。

  • 到网上观看一些免费的hadoop培训视频,很多网上的培训老师讲的还是很不错的,我们可以参照他们的视频从本地的hadoop Mapreduce的环境搭建,然后尝试编写mapreduce进行打包运行。

  • 当你对hadoop应用编程层面没有疑问的时候,可以尝试去深入了解mapreduce的核心思想,尤其是map,shuffle,join,reduce等。

再总结一下Hadoop入门的学习中可能遇到的问题——

1.常用Mapreduce进行数据处理的场景包括哪些?

- 文件统计行数

- 抽取文件中每行特定的字符或者对某个字段进行规整

- 对结构化文件的特定字段进行排序

- 文件之间进行关联

- 统计文件包含特定字符的个数等

2.在Hadoop使用中,应该如何诊断和分析故障?

对于新手而言,可以从hadoop区分为hdfs mapreduce两块去对异常进行分类,然后可以百度看一下解决方式。当对hadoop有一定了解之后,可以通过异常的提示,结合自己对框架本身的理解去尝试定位问题。

如何开始学习 Hadoop?相关推荐

  1. 从零开始学习hadoop之发行版选择

    从零开始学习hadoop之发行版选择 经常会看到这样的问题:零基础学习hadoop难不难?有的人回答说:零基础学习hadoop,没有想象的那么难,也没有想象的那么容易.看到这样的答案不免觉得有些尴尬, ...

  2. 零基础学习hadoop到上手工作线路指导(中级篇)

    2019独角兽企业重金招聘Python工程师标准>>> 此篇是在零基础学习hadoop到上手工作线路指导(初级篇)的基础,一个继续总结. 五一假期:在写点内容,也算是总结.上面我们会 ...

  3. hadoop学习——Hadoop核心组件

    hadoop学习--Hadoop核心组件 下图展示了hadoop生态系统的核心组件. 下面来简单介绍各个组件的作用: HDFS(Hadoop distribute file system)--Hado ...

  4. 学习hadoop需要什么基础

    2019独角兽企业重金招聘Python工程师标准>>> 学习hadoop需要什么基础 "学习hadoop需要什么基础"这已经不是一个新鲜的话题了,随便上网搜索一下 ...

  5. 学习hadoop需要具备基础知识

    学习hadoop需要具备基础知识 首先整体上了解Hadoop,包括hadoop是什么,能够做什么,使用场景等,不需要考虑细节问题.在有了整体上的了解后,就开始准备系统地学习hadoop.建议:勿一味学 ...

  6. 什么是Hadoop,怎样学习Hadoop

    Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS.HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它 ...

  7. 一脸懵逼加从入门到绝望学习hadoop之Caused by: java.net.UnknownHostException: master报错...

    一脸懵逼加从入门到绝望学习hadoop之Caused by: java.net.UnknownHostException: master报错 windows下开发hadoop应用程序,hadoop部署 ...

  8. 零基础学习Hadoop

    零基础学习hadoop,没有想象的那么困难,也没有想象的那么容易.在刚接触云计算,曾经想过培训,但是培训机构的选择就让我很纠结.所以索性就自己学习了.整个过程整理一下,给大家参考,欢迎讨论,共同学习. ...

  9. 学习Hadoop的前提条件

    This Article Is From :https://examples.javacodegeeks.com/enterprise-java/apache-hadoop/prerequisites ...

  10. 如何学习Hadoop,学习Hadoop要学什么?怎么学?

    如何学习Hadoop,学习Hadoop要学什么?怎么学? 第一章:初识Hadoop 第二章:更高效的WordCount 第三章:把别处的数据搞到Hadoop上 第四章:把Hadoop上的数据搞到别处去 ...

最新文章

  1. debug —— C语言 编译时候进行debug的调试
  2. 设计模式之-工厂方法模式
  3. GMIS 2017 大会余凯演讲:深度学习引领驾驶革命
  4. UI组件之ImageView及其子类(二)ImageButton ,ZoomButton
  5. MyEclipse导入eclipse的web项目,将WebRoot切换为WebContent
  6. [转]Data mining with WEKA, Part 3: Nearest Neighbor and server-side library
  7. 我是怎么进入Oracle这样的大企业的?
  8. STM32工作笔记0077---UCOSIII中使用串口发送数据要注意的点
  9. 东北老家有人在大连娶了媳妇
  10. web网页简繁汉字转换
  11. docker swarm 部署 sentry9.1.2
  12. 新睿云告诉您主流操作:分布式操作系统、批处理操作系统、分时操作系统优缺点分析!
  13. 【原创】全文搜索引擎技术原理入门
  14. springmvc+mybatis 无极限树形结构 Mapperxml 映射方法
  15. unison+inotify数据实时双向同步
  16. (附源码)springboot物联网智能管理平台 毕业设计 2111120
  17. Utf8和Unicode转换问题 C语言 千字文问题
  18. 764. 最大加号标志
  19. 目标检测学习笔记1---RCNN、SS、SVM
  20. 独立开发变现周刊(第80期):Notion页面转成网站客服小部件,月收入5K美金

热门文章

  1. 绿色时尚个人简历求职竞聘PPT模板
  2. C++ 圣诞节小游戏
  3. 一生中最值得读的书籍都在这里
  4. 湖南科技职业学院美景欣赏
  5. 哔哩哔哩千峰教育Git教程笔记(安装、分支、协作、冲突、GitHub、gitee、vscode集成git)
  6. Centos 搭建Git私有服务器
  7. Backtrader 基本使用教程 — 量化投资实战教程(1)
  8. 淘宝电影联合华谊的数据报告,还有哪些重要信息?
  9. [Unity3D]第一人称角色控制器
  10. 此 Google 帐号尚未与设备关联。要安装应用,请先访问设备上的 Play 商店应用。 了解详情(已解决)