所谓大数据(Big Data),就是需要处理的数据量非常巨大,已经达到了 TB、PB 甚至 EB、ZB 级别,需要成千上万块硬盘才能存储。传统的技术手段在大数据面前不堪一击,只能探索一套新的解决方案。

这套《大数据技术与应用教程》对大数据处理过程中涉及的各种关键技术做了详细的介绍,包括大数据思维、大数据采集、大数据处理、大数据存储、大数据挖掘、大数据应用等各个环节,帮助初学者规划了一条完整的学习路线。

这套教程只是一本入门指南手册,目的是给初学者指引方向,它虽然讲解了大数据的各种技术,但并不非常深入。对于大数据开发人员,还需要结合其它教程深度学习;对于大数据从业者,这些知识已经足够了。


年薪40+W的大数据开发【教程】,都在这儿!

1.大数据是什么
2.大数据时代
3.大数据的产生和作用
4.大数据时代的10个重大变化
5.大数据处理的基本流程
6.大数据涉及到的关键技术
7.大数据采集概述
8.通过系统日志采集大数据
9.通过网络爬虫采集大数据
10.Scrapy网络爬虫简介
11.大数据预处理架构和方法
12.数据清洗
13.数据集成
14.数据转换
15.数据消减
16.离散化和数值概念层次树
17.大数据处理技术
18.Google大数据处理系统
19.Hadoop大数据处理框架
20.HDFS
21.HDFS基本原理和设计理念
22.HDFS架构和实现机制
23.HDFS读取和写入数据
24.HDFS两种操作方式
25.NoSQL简介
26.NoSQL类型简介
27.HBase简介
28.HBase列式数据模型
29.HBase Shell
30.HBase主要运行机制
31.HBase常用Java API
32.HBase Java API编程实例
33.Hadoop MapReduce
34.Hadoop MapReduce架构
35.Hadoop MapReduce工作流程
36.MapReduce案例分析:单词计数
37.Hadoop MapReduce工作机制
38.MapReduce编程实例
39.Spark简介
40.Spark RDD
41.Spark总体架构和运行流程
42.Spark生态圈
43.Spark开发实例
44.Spark Streaming简介
45.Spark Streaming系统架构
46.Spark Streaming编程模型
47.Spark DStream相关操作
48.Spark Streaming开发实例
49.数据挖掘简介
50.Spark MLlib
51.数据挖掘之分类和预测
52.决策树和朴素贝叶斯算法
53.回归分析
54.聚类分析简介
55.k-means聚类算法
56.DBSCAN聚类算法
57.数据挖掘之关联规则分析
58.Apriori算法和FP-Tree算法
59.基于大数据的精准营销
60.基于大数据的个性化推荐系统
61.大数据预测
62.大数据的其他应用领域
63.大数据可以应用在哪些行业
64.大数据在金融行业的应用
65.大数据在互联网行业的应用
66.大数据在物流行业的应用

大数据入门基础教程系列相关推荐

  1. 大数据入门基础系列之初步认识大数据生态系统圈(博主推荐)

    不多说,直接上干货! 之前在微信公众平台里写过 大数据入门基础系列之初步认识hadoop生态系统圈 http://mp.weixin.qq.com/s/KE09U5AbFnEdwht44FGrOA 大 ...

  2. 大数据入门-基础篇01-hadoop框架简介

    声明:本文主要根据八斗学院孙国宇老师的Hadoop大数据实战手册进行的整理,仅限入门学习! 第一章 hadoop简介 Hadoop 是一个由 Apache 基金会所开发的 开源分布式系统基础架构.用户 ...

  3. 大数据入门 - 基础概念

    文章目录 1. 发展历史 2. 分布式系统 可靠性 可扩展性 可维护性 4. 单机引擎的问题 事务 写入和存储 数据的序列化 3. GFS(Google File System) master 的快速 ...

  4. Java学习开发入门基础教程系列

    ava是一种跨平台的语言,一次编写,到处运行,在世界编程语言排行榜中稳居第二名(第一名是C语言). Java用途广泛,可以用来开发传统的客户端软件和网站后台,也可以开发如火如荼 Android 应用和 ...

  5. web前端开发入门基础教程系列

    前端工程师是互联网时代软件产品研发中不可缺少的一种专业研发角色.从狭义上讲,前端工程师使用 HTML.CSS.JavaScript 等专业技能和工具将产品UI设计稿实现成网站产品,涵盖用户PC端.移动 ...

  6. 大数据入门基础:SSH介绍

    什么是ssh 简单说,SSH是一种网络协议,用于计算机之间的加密登录. 如果一个用户从本地计算机,使用SSH协议登录另一台远程计算机,我们就可以认为,这种登录是安全的,即使被中途截获,密码也不会泄露. ...

  7. 大数据零基础如何入门教程

    程序员必看大数据教程最全1024G学习资料免费赠送详解,大数据工作者可以施展拳脚的领域非常广泛,从国防部.互联网创业公司到金融机构,到处需要大数据项目来做创新驱动.数据分析或数据处理的岗位报酬也非常丰 ...

  8. 大数据入门教程系列之Hive内置函数及自定义函数

    本篇文章主要介绍Hive内置函数以及自定义UDF函数和UDFT函数,自定义UDF函数通过一个国际转换中文的例子说明. 操作步骤: ①.准备数据和环境 ②.演示Hive内置函数 ③.自定义UDF函数编写 ...

  9. Hadoop大数据零基础高端实战培训系列配文本挖掘项目

    <Hadoop大数据零基础高端实战培训系列配文本挖掘项目(七大亮点.十大目标)> 课程讲师:迪伦 课程分类:大数据 适合人群:初级 课时数量:230课时 用到技术:部署Hadoop集群 涉 ...

最新文章

  1. 使用GruntJS构建Web程序 (1)
  2. 31,32,33_过拟合、欠拟合的概念、L2正则化,Pytorch过拟合欠拟合,交叉验证-Train-Val-Test划分,划分训练集和测试集,K-fold,Regularization
  3. CSS实现段落首行缩进、1.5倍行距、左右对齐
  4. eclipse启动项目
  5. LocalStorage与SessionStorage
  6. (23)System Verilog旗语解决资源共享需求
  7. mysql性能优化的最佳20条经验_MySQL性能优化的最佳20+条经验
  8. 矩阵分析与应用课程资料
  9. Scrapy爬取淘宝网数据的尝试
  10. 基于MATLAB的语音信号设计,基于MATLAB的语音信号处理系统设计
  11. template应用之Policies和Policy Classes
  12. 自定义 Spring Starter
  13. Uber收购动作引发巨震  美国外卖“三国杀”有望诞生“美团”?
  14. 【华人学者风采】胡事民 清华大学
  15. Android开发各版本适配(不断更新)
  16. html53列多行表格样式,教程(53):表格之美--了解布局菜单!
  17. 创新型中小企业申报流程
  18. 互联网乱弹之360的云存储
  19. 苹果原壁纸高清_精选创意设计系列高清苹果手机壁纸
  20. 创蓝闪验php手机号一键登录

热门文章

  1. LeetCode-Majority Element II
  2. 20个优秀的JavaScript 键盘事件处理库
  3. asp.net mvc自动完成
  4. Go web 编程资源
  5. 吴恩达 coursera AI 专项四第二课总结+作业答案
  6. 多台工作站搭建MPI并行环境
  7. 坐标系旋转变换公式图解
  8. ubuntu下搜索文件
  9. android 蓝牙传输分包,彻底掌握Android多分包技术(一)
  10. zepto的ajax使用,Ajax的实现及使用-zepto