戳蓝字“CSDN云计算”关注我们哦!

技术的日新月异,让我们见证了Hadoop十年从无到有,再到称王。2006年项目成立的一开始,“Hadoop”这个单词只代表了两个组件——HDFS和MapReduce。到现在的10个年头,这个单词代表的是“核心”以及与之相关的一个不断成长的生态系统。今天,我们就来一起看看关于Hadoop的精华问答。

1


















Q:能不能给点Hadoop的学习方法以及学习规划,Hadoop系统有点庞大,感觉无从学起。

A:首先搞清楚什么是Hadoop以及Hadoop可以用来做什么?然后,可以从最经典的词频统计程序开始,初步了解MapReduce的基本思路和处理数据的方式。接着,就可以正式学习Hadoop的基本原理,包括HDFS和MapReduce,先从整体,宏观核心原理看,先别看源码级别。进一步,就可以深入HDFS和MapReduce和模块细节,这个时候可以结合源码深入理解,以及实现机制。最后就是需要实战了,可以结合自己的项目或者相关需求来完成一些Hadoop相关应用。

2

Q:以后想从事大数据方面工作,算法要掌握到什么程度,算法占主要部分吗?

A:首先,如果要从事大数据相关领域的话,Hadoop是作为工具来使用的,首先需要掌握使用方法。可以不用深入到Hadoop源码级别细节。然后就是对算法的理解,往往需要设计到数据挖掘算法的分布式实现,而算法本身你还是需要理解的,例如常用的k-means聚类等。

3

Q:大数据处理都是服务器上安装相关软件吗,对程序有什么影响呢,集群、大数据是属于运维的工作内容还是工程师的呢?

A:传统的程序只能运行在单机上,而大数据处理这往往使用分布式编程框架编写,例如Hadoop MapReduce,只能运行在Hadoop集群平台上。

运维的责任:保证集群,机器的稳定性和可靠性

Hadoop系统本身研发:提高Hadoop集群的性能,增加新功能。

大数据应用:把Hadoop作为工具,去实现海量数据处理或者相关需求。

4

Q:Hadoop适不适用于电子政务?为什么?

A:电子政务是利用互联网技术实现政府组织结构和工作流程的重组优化,建成一个精简、高效、廉洁、公平的政府运作信息服务平台。因此电子政务肯定会产生相关的大量数据以及相应的计算需求,而这两种需求涉及的数据和计算达到一定规模时传统的系统架构将不能满足,就需要借助海量数据处理平台,例如Hadoop技术,因此可以利用Hadoop技术来构建电子政务云平台。

总结一下,任何系统没有绝对的适合和不适合,只有当需求出现时才可以决定,在一个非常小的电子政务系统上如果没有打数据处理以及计算分析需求时就不需要hadoop这样的技术,而实际上,商用的电子政务平台往往涉及到大规模的数据和大量的计算分析处理需求,因此就需要Hadoop这样的技术来解决。

5

Q:非大数据的项目能否用Hadoop?

A:非大数据项目是否可以用Hadoop的关键问题在于是否有海量数据的存储,计算,以及分析挖掘等需求,如果现有系统已经很好满足当前需求那么就没有必要使用Hadoop,没有必要使用并不意味这不能使用Hadoop,很多传统系统能做的Hadoop也是可以做的,例如使用HDFS来代替LINUX NFS,使用MapReduce来代替单服务器的统计分析相关任务,使用Hbase代替MySQL等关系数据库等,在数据量不大的情况下通常Hadoop集群肯定比传统系统消耗更多的资源。

----------------    --------------

小伙伴们冲鸭,后台留言区等着你!

关于Hadoop,今天你学到了什么?还有哪些不懂的?除此还对哪些话题感兴趣?快来留言区打卡啦!留言方式:打开第XX天,答:……

同时欢迎大家搜集更多问题,投稿给我们!风里雨里留言区里等你~

----------------    --------------

1.微信群:

添加小编微信:color_ld,备注“进群+姓名+公司职位”即可,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

2.征稿:

投稿邮箱:liudan@csdn.net;微信号:color_ld。请备注投稿+姓名+公司职位。

推荐阅读

  • Kafka学习笔记

  • “拼多多”惊爆重大 Bug!程序员的眼泪,羊毛党的狂欢

  • “黄鳝门”视频女主播一审宣判!

  • 12306能扛住明星出轨这种流量冲击吗?

  • V神说,解释以太坊2.0最好的文章就是这篇了

  • 以太坊升级的拖油瓶,竟只是这几行代码

  • 程序员有话说 | 程序猿在乘地铁的时候都在想什么?  推 荐 

点击“阅读原文”,打开 CSDN App 阅读更贴心!

喜欢就点击“好看”吧!

Hadoop精华问答 | 非大数据的项目能否用Hadoop?相关推荐

  1. Hadoop+hive+flask+echarts大数据可视化项目之hive环境搭建与系统数据的分析思路

    Hadoop+hive+flask+echarts大数据可视化项目(四) --------------hive环境搭建与系统数据的分析思路---------------- 关注过Hadoop+hive ...

  2. Hadoop+hive+flask+echarts大数据可视化项目之系统数据整合和hadoop环境搭建

    Hadoop+hive+flask+echarts大数据可视化项目(二) --------------系统数据整合和hadoop环境搭建---------------- 关注Hadoop+Hive+F ...

  3. Hadoop+hive+flask+echarts大数据可视化项目之flask结合echarts前后端结合显示hive分析结果

    Hadoop+hive+flask+echarts大数据可视化项目(五) ------flask与echarts前后端结合显示hive分析结果------- 关注过Hadoop+hive+flask+ ...

  4. Hadoop+hive+flask+echarts大数据可视化之系统数据收集

    Hadoop+hive+flask+echarts大数据可视化项目(一) --------------系统数据收集---------------- 谈到大数据的项目,一般以数据可视化为主体,收集大数据 ...

  5. 任谦:实践是大数据提升项目的灵魂丨优秀毕业生专访

    [ 导读 ] 清华-青岛数据科学研究院(以下简称"数据院")自2014年4月成立以来,秉承"学校统筹,问题引导,社科突破,商科优势,工科整合,业界联盟"24字指 ...

  6. 我的大数据学习知录(1)-Hadoop

    在上一篇我对大数据做了简单的介绍,引出了本篇的主角--Hadoop--一个适合大数据的分布式存储和计算平台,本篇就来唠唠它. 1️⃣什么是Hadoop 前文不止一次地介绍说:Hadoop是一个适合大数 ...

  7. 大数据实战项目之电商数仓(一)

    大数据实战项目之电商数仓(一) 项目介绍 数据仓库概念 ​ 数据仓库是为企业所有决策制定过程,提供所有系统数据支持的战略集合.通过对数据仓库中数据的分析,可以帮助企业改进业务流程,控制成本,提高产品质 ...

  8. 盘点2017年晋升为Apache TLP的大数据相关项目

    本文原文:https://www.iteblog.com/archives/2310.html,如下面格式排版错乱,请点击下面阅读原文进入本博客阅读. 本文主要盘点了 2017 年晋升为 Apache ...

  9. 大数据讲课笔记2.3 初探Hadoop世界

    文章目录 零.学习目标 一.导入新课 二.新课讲解 (一)Hadoop的前世今生 1.Google处理大数据三大技术 2.Hadoop如何诞生 3.Hadoop主要发展历程 (二)Hadoop的优势 ...

最新文章

  1. bug诞生记——临时变量、栈变量导致的双杀
  2. 如何在ARM开发板上从源码编译安装OpenCV和OpenCV contrib
  3. 印度资深数字货币研究员::我为什么选择BCH?
  4. Java常用的技术网站
  5. 网易举办首届云创大会,优云软件助力司南战略
  6. 九、PyQt5 QLineEdit输入的子网字符串校验QRegExp
  7. 中科大计算机本科毕业论文范文,中国科大本科生毕业论文管理再上新台阶
  8. Redis 如何简化实现微服务的设计模式?
  9. java 反射 对象的方法_Java通过反射调用对象的方法
  10. caffe上手:caffe训练一般过程--wanglei 写给自己
  11. Vulkan入门(9)-渲染和显示.md
  12. VB进度条 游戏血条控件
  13. UE源码版本下载编译全流程
  14. 计算机保存到桌面显示不出来,excel表格在电脑桌面显示不出来是什么原因?
  15. QT设计风速仪上位机实例(串口读写数据处理数据下载)
  16. websphere修改协议为TLS1.2
  17. c语言实现的学生信息查询系统
  18. 【JavaScript】为什么是script error.
  19. iOS游戏开发之Game Center研究
  20. LATEXT导入.sty

热门文章

  1. php 控制器 模板,php学习笔记(一)php模板与控制器
  2. 乔布斯在斯坦福大学演讲稿英文_西方大文豪最爱的10个英文单词,写尽人世间细腻情感!...
  3. yarn 卸载包_0609-6.1.0-如何卸载CDH6.1
  4. 被阿里P8面了两个小时,技术、业务有来有回......
  5. 女孩子们,你的专业由你做主
  6. 卷烟厂招工内卷:要求本科以上,但报名的硕士太多
  7. 数学系鄙视物理系的经典桥段,全部看懂了算我输!
  8. 文末赠书100本 | 当下最火爆的机器学习算法
  9. idea创建springboot项目,一直在reading pom.xml
  10. 台式计算机装系统,教你台式电脑重装系统方法