大数据基础学习

大数据基础入门

为什么要学习大数据

1、目的:要份很好工作(钱)

2、对比:Java开发和大数据开发

什么是大数据?

举例:

1、商品推荐:问题:

(1)大量的订单如何存储?

(2)大量的订单如何计算?

2、天气预报:问题:

(1)大量的天气数据如何存储?

(2)大量的天气数据如何计算?

如果你想要学好大数据最好加入一个好的学习环境,可以来这个Q群251956502 这样大家学习的话就比较方便,还能够共同交流和分享资料

什么是大数据,本质?

(1)数据的存储:分布式文件系统(分布式存储)

(2)数据的计算:分布式计算

Java和大数据是什么关系?

1、Hadoop:基于Java语言开发

2、Spark:基于Scala语言,Scala基于Java语言

学习大数据需要的基础和路线

1、学习大数据需要的基础:

Java基础(JavaSE)—> 类、继承、I/O、反射、泛型*****

Linux基础(Linux的操作) —> 创建文件、目录、vi编辑器***

2、学习路线:

(1)Java基础和Linux基础

(2)Hadoop的学习:体系结构、原理、编程

(*)第一阶段:HDFS、MapReduce、HBase(NoSQL数据库)

(*)第二阶段:数据分析引擎 —> Hive、Pig

数据采集引擎 —> Sqoop、Flume

(*)第三阶段:HUE:Web管理工具

ZooKeeper:实现Hadoop的HA

Oozie: 工作流引擎

(3)Spark的学习

(*)第一个阶段:Scala编程语言

(*)第二个阶段:Spark Core-----> 基于内存,数据的计算

(*)第三个阶段:Spark SQL -----> 类似Oracle中的SQL语句

(*)第四个阶段:Spark Streaming—>

进行实时计算(流式计算)比如:自来水厂

(4)Apache Storm:类似Spark Streaming —> 进行实时计算 (流式计算):比如:自来水厂

(*)NoSQL:Redis基于内存的数据库

大数据学习方法,学习大数据需要的基础和路线相关推荐

  1. 【大数据】学习大数据前需要掌握的知识

    一谈到大数据技术,很多人首先想到的是数学,大概是因为数字在数学体系中稳固的位置吧,这也是理所当然的.大数据时代已经被抄的很热了,这个行业目前已经逐渐成熟,想学习大数据开发的人越来越多.每天我们在互联网 ...

  2. 大数据的学习需要预先了解哪些基础知识?

    计算机的基本工作就是处理数据,包括磁盘文件中的数据,通过网络传输的数据流或数据包,数据库中的结构化数据等.随着互联网.物联网等技术得到越来越广泛的应用,数据规模不断增加,TB.PB量级成为常态,对数据 ...

  3. 数据科学学习之数据和抽样分布

    专栏/前文链接 本文为笔者<数据分析与数据科学>专栏中的第二篇, 专栏的链接在这里. 第一篇博文的链接在这里. 希望本文与此专栏能够对接触,学习和研究数据科学的各位有所帮助. 本文介绍的是 ...

  4. DAMA数据治理学习笔记-数据质量

    数据质量 定义 为了确保满足数据消费者的需求,应用数据管理技术进行规划.实施.控制等管理活动 业务驱动因素 提高组织数据价值和数据利用的机会 提高低质量数据导致的风险和成本 提高组织效率和生产力 保护 ...

  5. DAMA数据治理学习笔记-数据治理

    数据治理 定义 对数据资产管理行使权力.控制和共享决策(规划.监测和执行)的系列活动. 目标 提升企业数据资产管理能力 定义.规划.批准.执行数据管理的原则.政策.程序.指标.工具.责任. 监控和指导 ...

  6. 数据可视化学习(数据可视化基本概念)

    本篇文章翻译自数据可视化入门教程 数据可视化(Data Visualization)和信息可视化(Infographics)是两个相近的专业领域名词.狭义上的数据可视化指的是数据用统计图表方式呈现,而 ...

  7. 数据安全技术学习--DLP  数据防泄漏

    1.DLP  数据防泄漏  Data Loss/Leakage  Protection/Prevention 主要技术和产品: 文档加密. 文档权限控制.DLP产品. 数据防泄漏系统(DLP产品)深度 ...

  8. (数据科学学习手札45)Scala基础知识

    一.简介 由于Spark主要是由Scala编写的,虽然Python和R也各自有对Spark的支撑包,但支持程度远不及Scala,所以要想更好的学习Spark,就必须熟练掌握Scala编程语言,Scal ...

  9. 女生学习大数据怎么样~有前景么

    当前大数据发展前景非常不错,且大数据领域对于人才类型的需求比较多元化,女生学习大数据也会有比较多的工作机会.大数据是一个交叉学科涉及到的知识量比较大学习有一定的难度,女生则有女生的优势,只要认真学习了 ...

  10. 双非电子专业,大二京东实习,大三上岸字节大数据开发实习岗,分享一波面经...

    点击上方 "大数据肌肉猿"关注, 星标一起成长 点击下方链接,进入高质量学习交流群 今日更新| 950个转型案例分享-大数据交流群 今天分享学习群同学的求职经历,他是双非电子专业, ...

最新文章

  1. SQL操作的组成部分-数据控制
  2. VS中的路径宏 vc++中OutDir、ProjectDir、SolutionDir各种路径
  3. vector容器与find算法
  4. 如何修炼成某一领域的高手
  5. 1050 循环数组最大子段和
  6. 最短路径迪杰斯特拉算法 c语言,Dijkstra第K最短路径算法
  7. CommonJS概述及使用
  8. run()方法和start()方法测试解析
  9. 机器学习算法--ALS
  10. Java SpringMVC
  11. 菊子曰测试草稿{29C28FD771BA4B0D8693}
  12. MySQL中多表的连接
  13. java设置请求头_前端需要知道的 HTTP 安全头配置
  14. iphone根目录索引大全
  15. 【梦幻西游】12门派版一键端
  16. 中南大学电磁场理论matlab,中南大学电磁场理论实验2.doc
  17. # Maven错误Error executing Maven
  18. dreamweaver html模版,dw网页设计模板
  19. WiMAX与Wi-Fi、DSL和3G的竞合关系
  20. word按backspace键不能删除问题

热门文章

  1. 中国大学MOOC C语言程序设计(大连理工大学) 课后编程题 第十一周题解(个人向仅供参考)
  2. win10使用pip安装tensorflow
  3. 天天预约|新功能工具「美团优惠券」上线啦!
  4. 扶不起的优酷,做不好的阿里大文娱,路远!
  5. Linux安装unrar
  6. ARP病毒的分析与防治
  7. ORA-01029,ORA-01033错误处理
  8. 对传统优化算法的一些总结(上)
  9. python中如何清空_python中如何清空数组(列表)元素
  10. 典型相关分析及R应用