大数据给很多人的感觉是,专业性强,操作繁琐,属于“高大上”的技术。大数据人才供不应求,有一些人则看到了大数据带来的机遇,想通过专业的培训来学习大数据,那么大数据从0开始需要学习些什么内容呢?今天加米谷大数据就来说一下。

一、0基础学习大数据需要Java基础

Java:开发需求最多的编程语言之一,可以从事网站开发、桌面程序设计、游戏开发、安卓后台开发、全栈开发等。它可以说是大数据最基础的编程语言,一是大数据的本质是海量数据的计算,查询与存储,后台开发很容易接触到大数据量存取的应用场景;二是Java天然的优势,大数据的组件很多是用Java开发的。

零基础小白想学习大数据,需要从Java基础开始学起,可以把Java语言作为第一个入门语言。一般来说,学会JavaSE就可以了,但能掌握JavaEE的话会更好。

JavaSE:变量、循环、if等等;面向对象;I/O输入和输出(HDFS会用到);反射、泛型,MR查询;JDBC:操作关系型数据库(RDBMS)(HIVE会用到)。

:如果你对于大数据开发感兴趣,想系统学习大数据的话可以戳我加入大数据技术学习交流群,私信管理员即可免费领取开发工具及视频入门学习资料

二、大数据需要学习Linux系统管理、Shell编程设计、Maven

Linux是一套免费使用和自由传播的类Unix操作系统,是一个基于POSIX和UNIX的多用户、多任务、支持多线程和多CPU的操作系统。Shell是一个用C语言编写的程序,它是用户使用Linux的桥梁;Shell既是一种命令语言,又是一种程序设计语言。Shell是一个命令解释器,解释执行用户所输入的命令和程序。Maven是一个项目管理工具,可以通过一小段描述信息来管理项目的构建,报告和文档的项目管理。

大数据技术往往运行在Linux环境下,大数据的分布式集群(Hadoop,Spark)都是搭建在多台Linux系统上,对集群的执行命令都是在Linux终端窗口输入......想从事大数据相关工作,需要掌握Linux系统操作方法和相关命令。

Linux:Linux安装、CentOS、目录结构(文件类型、权限、用户命令)、Linux命令、基本操作-SQL基础:Select(重点)insertupdatedelete(Hive、SparkSQL会用到)等;大数据的终极目标:使用SQL分析大数据。

Shell:变量、if条件判断语句、shell函数、Case条件语句、while循环和until型循环、for循环和select循环、条件与循环控制及状态返回值、shell数组等。

对于Java程序员,大数据的主流平台hadoop是基于Java开发的,所以Java程序员往大数据开发方向转行从语言环境上更为顺畅,另外很多基于大数据的应用框架也是Java的,所以在很多大数据项目里掌握Java语言是有一定优势的。

当然,hadoop核心价值在于提供了分布式文件系统和分布式计算引擎,对于大部分公司而言,并不需要对这个引擎进行修改。这时候除了熟悉编程,你通常还需要学习数据处理和数据挖掘的一些知识。尤其是往数据挖掘工程师方向发展,则你需要掌握更多的算法相关的知识。

对于数据挖掘工程师而言,虽然也需要掌握编程工具,但大部分情况下是把hadoop当做平台和工具,借助这个平台和工具提供的接口使用各种脚本语言进行数据处理和数据挖掘。因此,如果你是往数据挖掘工程方向发展,那么,熟练掌握分布式编程语言如scala、spark-mllib等可能更为重要。

Java程序员转大数据工程师的学习路线图:

第一步:分布式计算框架

掌握hadoop和spark分布式计算框架,了解文件系统、消息队列和Nosql数据库,学习相关组件如hadoop、MR、spark、hive、hbase、redies、kafka等;

第二步:算法和工具

学习了解各种数据挖掘算法,如分类、聚类、关联规则、回归、决策树、神经网络等,熟练掌握一门数据挖掘编程工具:Python或者Scala。目前主流平台和框架已经提供了算法库,如hadoop上的Mahout和spark上的Mllib,你也可以从学习这些接口和脚本语言开始学习这些算法。

第三步:数学

补充数学知识:高数、概率论和线代

第四步:项目实践

1)开源项目:tensorflow:Google的开源库,已经有40000多个star,非常惊人,支持移动设备;

2)参加数据竞赛

3)通过企业实习获取项目经验

如果你仅仅是做大数据开发和运维,则可以跳过第二步和第三步,如果你是侧重于应用已有算法进行数据挖掘,那么第三步也可以先跳过。

java决策树算法_零基础学习大数据开发技术需要哪些基础知识(1)Java、大数据基础...相关推荐

  1. java决策树算法_「Smile」一下,轻松用Java玩转机器学习

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI Smile,如其名,会是一个让你「笑着用」的好工具. 它的全名叫做 Statistical Machine Intelligence and ...

  2. BigData:大数据开发的简介、核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS、HBase、Hive}+Docker)、经典场景应用之详细攻略

    BigData:大数据开发的简介.核心知识(linux基础+Java/Python编程语言+Hadoop{HDFS.HBase.Hive}+Docker).经典场景应用之详细攻略 BigData:大数 ...

  3. 适合零基础学习的IT编程技术

    现在很多应届生,不管是否是计算机专业,都想毕业后从事IT行业,不仅是因为IT行业的薪资高,更主要是IT行业就业需求多,发展好,工作稳定,学IT,技术在手,天下我走,当然,IT行业有很多学科方向,学习哪 ...

  4. 零基础学习百度云开发(一) 初见效果

    零基础学习百度云开发(一) 初见效果 1, 百度云->登陆->花1元开通物接入IOT-Hub 2, 创建物模型->创建物影子, 例如物影子, 名称 temp 3, 可以创建权限组,例 ...

  5. 女孩子零基础学习web前端开发怎么…

    ·  网页开发工具: 学习web前端开发,网页开发工具有FrontPage,会用 Word 的人很容易学会FrontPage.还有一个常用的是Dreamweaver.这两种都是使用最多的HTML网页制 ...

  6. hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶

    hadoop大数据开发技术学习笔记第三天:(前序)MySQL数据库进阶 一.回顾知识 1.myschool数据库和数据表的创建 (1)创建数据库 (2)数据库模型图 (3)创建数据表grand (4) ...

  7. 大数据 - 大数据开发技术课程总结(未完)

    1.课程介绍 大数据开发课程主要从了解大数据概念.特征开始,再介绍大数据Java开发和Hadoop的环境配置,较为全面地讲解了HDFS分布式存储,MapReduce分布式计算框架,Spark平台开发和 ...

  8. 你不得不关注的5 大Android 开发技术——2020

    虽然编程环境每天都有新变化,但 Android 无疑是其中更新迭代最频繁的,每年甚至每个月都有新东西.本文介绍了 2020 年开发者最需要关注的 5 大 Android 开发技术. 在众多 Andro ...

  9. 【大数据开发技术】期末押题(暨考试题)

    [大数据开发技术]期末押题 A卷 选择10道 1. 配置Hadoop时,JAVA_HOME包含在哪一个配置文件中. 2. HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错.高可靠性 ...

  10. 大数据开发技术课程报告(搭建Hadoop完全分布式集群操作集群)

    文章目录 大数据开发技术课程报告内容及要求 一. 项目简介和实验环境 二. 虚拟机的各项准备工作 三. 安装JDK并配置环境变量 四. 安装Hadoop并配置环境变量 五. 配置Hadoop完全分布式 ...

最新文章

  1. SQL学习笔记-嵌套查询
  2. 基本数据类型存储空间
  3. shiro框架@RequiresPermissions 解释
  4. hadoop扩充磁盘操作记录
  5. 【剑指offer】面试题14- I:剪绳子(Java)
  6. 实测金山毒霸极速版杀毒软件表现
  7. c语言程序设计2020年版,2020年新版c语言程序设计题库.docx
  8. 进销存软件排行榜前十名!
  9. oracle索引index_type,oracle index索引相关笔记
  10. 苹果手机投屏到pc电脑
  11. 程序员学英语之如何优雅的将单词本导出的txt文本转换为Excel
  12. ei拼音的四个声调对应的字_幼儿园学前班拼音教案复习ei以及四声调
  13. vue 扁平化_JS数组扁平化(flat)
  14. Gitlab服务器 forbidden
  15. kafka消费模型,分区,偏移量等
  16. iphone充电图_哪些iPhone具有无线充电功能?
  17. 中文翻译拉丁文转换_实时正则表达式(猪拉丁文翻译器)
  18. 安全狗防护引擎安装失败
  19. .net程序员求职简历
  20. 秘宝猎人服务器维护,《秘宝猎人》官方网站

热门文章

  1. 第一章:x264视频制作meGUI工具下载
  2. 桌面有u盘符计算机里没有了,教你电脑不显示u盘盘符怎么办
  3. 软件测试基本功 系列教程
  4. Java虚拟机知识点【方法调用】
  5. java 面试基础总结(二)---多线程
  6. 使用eclipse搭建maven项目Java web项目
  7. 每天一道面试题(2):实现strncpy
  8. EnterpriseLibrary2.0的学习-DAAB
  9. 数据库索引系列四:索引算法Hash与BTree的区别
  10. 为什么JavaScript中给变量赋值会影响到其他地方?