本文旨在为普通程序员(Java程序员最佳)提供一个入门级别的大数据技术学习路径,不适用于大数据工程师的进阶学习,也不适用于零编程基础的同学。


前言:

  • 一、背景介绍
  • 二、大数据介绍

正文:

  • 一、大数据相关的工作介绍
  • 二、大数据工程师的技能要求
  • 三、大数据学习规划
  • 四、持续学习资源推荐(书籍,博客,网站)
  • 五、项目案例分析(批处理+实时处理)

前言

一、背景介绍

本人目前是一名大数据工程师,项目数据50T,日均数据增长20G左右,个人是从Java后端开发,经过3个月的业余自学成功转型大数据工程师。

二、大数据介绍

大数据本质也是数据,但是又有了新的特征,包括数据来源广数据格式多样化(结构化数据、非结构化数据、Excel文件、文本文件等)、数据量大(最少也是TB级别的、甚至可能是PB级别)、数据增长速度快等。

针对以上主要的4个特征我们需要考虑以下问题:

  1. 数据来源广,该如何采集汇总?,对应出现了Sqoop,Cammel,Datax等工具。

  2. 数据采集之后,该如何存储?,对应出现了GFS,H

大数据-大数据学习过程相关推荐

  1. 用 Python 制作数据大屏,超简单

    作者 | 俊欣 来源 | 关于数据分析与可视化 今天我们用Streamlit模块来制作一个数据面板,将数据更加直观地呈现给别人观看,整个页面大致如下图所示: 制作工具栏 在页面的左侧是一个工具栏,工具 ...

  2. 3000 字推荐一个可视化神器,50 行 Python 代码制作数据大屏

    作者 | 俊欣 来源 | 关于数据分析与可视化 今天小编给大家分享一个制作数据大屏的工具,非常的好用,100行左右的Python代码就可以制作出来一个完整的数据大屏,并且代码的逻辑非常容易理解. Py ...

  3. 工资8000以下的程序员注意了:《零coding数据大屏实战宝典.pdf》

    马云曾说:"整个世界将变成数据,这还只是数据时代的开始.新浪潮即将来临,很多就业机会将被夺走.有些人会赶上潮流,变得富有和成功.但是对那些落后的人,未来将是痛苦的. 大数据从2013年一路发 ...

  4. 除了数据还是数据?2018年5大 AI (人工智能)预测

    人工智能 (AI) 在 2017 年已成为多数人日常生活的一部份,不论是在工作场所或是居家生活,而随着新的一年将至,<福布斯>杂志也对 AI 进入 2018 年的成长与发展进行预测: 数据 ...

  5. 海量大数据大屏分析展示一步到位:DataWorks数据服务对接DataV最佳实践

    概述 数据服务(https://ds-cn-shanghai.data.a... 是DataWorks产品家族的一员,提供了快速将数据表生成API的能力,通过可视化的向导,一分钟"零代码&q ...

  6. 如何构建可视化的营销数据大屏?

    数据可视化大屏是数据展现最直观最全面的方式之一,对于企业重要数据指标的展示和实时数据的监测,是目前极佳的方案. 对于大屏数据展示,某知名汽车制造厂商的信息化团队有着深刻的建设经验. 该公司目前拥有两个 ...

  7. 大数据环境下数据科学的知识体系

    数据科学概论 随着互联网的飞速发展,大数据(Big Data)的概念和技术成为当下流行的领域. 数据科学(Data Science)这一体系也随着大数据的崛起成为讨论热点.在各大招聘网站上," ...

  8. 大数据数据收集数据困难_大数据架构、大数据开发与数据分析的区别

    是新朋友吗?记得先点蓝字关注我哦- 今日课程菜单 Java全栈开发 | Web前端+H5 大数据开发 | 数据分析  人工智能+Python | 人工智能+物联网 来源:小职(z_zhizuobiao ...

  9. 为什么大数据需要数据湖?

    自2011年"数据湖"概念被提出,业界便对数据湖一直有着广泛而不同的理解和定义. "数据湖是一个集中化存储海量的.多个来源,多种类型数据,并可以对数据进行快速加工,分析的 ...

  10. 非常复杂,上双11数据大屏背后的秘密:大规模流式增量计算及应用

    回顾大数据技术领域大事件,最早可追溯到06年Hadoop的正式启动,而环顾四下,围绕着数据库及数据处理引擎,业内充斥着各种各样的大数据技术.这是个技术人的好时代,仅数据库领域热门DB就有300+,围绕 ...

最新文章

  1. android教程 - android ui 介绍,多图详解 “Android UI”设计官方教程
  2. 半连接队列 全连接队列??
  3. knockout的使用
  4. FlexViewer入门资料
  5. 2020-07-01 CVPR2020 表示学习论文讨论(2) 笔记
  6. xman的思维导图快捷键_这个良心好用的思维导图软件,居然不用氪金充钱
  7. dynamodb java_使用Java第2部分查询DynamoDB项
  8. 使用Prometheus和Grafana监视开放自由
  9. 学习linux第二周作业
  10. 回旋矩形C语言,C语言回旋函数解释下,该如何处理
  11. MVC3学习 八 Action和result过滤器及日志处理
  12. 2007年度工作总结
  13. MySql修改默认端口
  14. 一个好玩的在线Android图形可视化开发工具  App Inventor
  15. makefile是如何自动生成的
  16. 给红米Note 4X编译LineageOS 14.1刷机包过程【详细】
  17. python 请在微信客户端打开_完美解决 请在微信客户端打开链接
  18. 你永远不知道明天和意外哪个先到来
  19. Java学习笔记(四):数组操作
  20. GameBuilder游戏开发系列之见缝插针(AA)

热门文章

  1. #最全面# Python 下将 opencv MAT ( numpy ndarray ) 彩色 或 灰度 图像转化为 QImage 对象
  2. 【系统分析师之路】2011年系统分析师下午案例分析真题
  3. 语音备忘录里的录音怎么导出来
  4. 嵌入式经典面试题总结
  5. 极飞C2000分析报告
  6. 前端实现浏览器自动弹开三屏、一键关闭效果
  7. Linux文件删除但空间不释放问题篇
  8. 结合GUI可视化发送QQ消息 —— 2022/2/11
  9. 高考失利之后,属于我的大学本科四年
  10. ios系统设置z-index不生效问题