入门了解

最近在大数据分析岗位实习,因为尚在入门所以就只能先做一个sqlboy啦,然后慢慢学习一点大数据相关开发的工作.

目录

  • 入门了解
    • 大数据开发与后端的区别
    • 大数据开发需要会什么
        • 一些组件
      • 开源的数据计算引擎
      • 大数据入门为什么要先学计算引擎

大数据开发与后端的区别

传统的后端java一般是用的spring全家桶,处理的数据量有上限,基于传统的数据库的CRUD与前端查询的接口

CRUD
增加(Create)、检索(Retrieve)、更新(Update)和删除(Delete)

数据库可以抽象为三个部分:
数据接入部分
数据计算部分(数据计算引擎)
结果存储部分

大数据开发需要会什么

说实话因为专业是智能,第一次听说需要懂这些东西

一些组件

  • Doug Cutting开山鼻祖首创Hadoop
  • 消息队列组件KafKa(乍一听有点像那个作家卡夫卡)
  • 数据存储组件Hadoop HDFS
    分布式文件系统的鼻祖
  • 分布式计算引擎Spark
    先进的思想
    高效的编程模型
    完备的软件生态
  • 分布式仓库HIVE
  • 分布式数据库HBASE
  • 分布式搜索引擎Elasticsearch

开源的数据计算引擎

  • MapReduce、Tez暂时不用考虑
    (只是作为OLAP的内置计算引擎)
  • Strom(只是单一的流式处理没有批处理)
  • Spark兼容性更好
  • Flink

大数据入门为什么要先学计算引擎

  • 不需要额外的设施
    只需要一个IDE工具引入对应的jar包
  • 地位核心承上启下决定运行效率
    上接存储数据的数据源Kfaka、HDFS、Hive
    下接结果存储的数据库Hbase、Elasticsearch、Mysql
  • 使用频繁
  • 与其他组件更紧密,可以读文件系统、数据库、消息队列,只要能存储都有对应的读api和写api

[持续更新]大数据岗位实习日志相关推荐

  1. 2021 Java后端+大数据暑期实习大厂面经

    目录 高频考点 操作系统篇 1.进程与线程的区别[常问] 2.进程的通信方式?[常问] 3.操作系统调度方法?[腾讯] 4.缓存算法(页面置换算法)?[字节.腾讯] 5.什么是死锁?如何避免死锁? 6 ...

  2. Cris 玩转大数据系列之日志收集神器 Flume

    Cris 玩转大数据系列之日志收集神器 Flume Author:Cris 文章目录 Cris 玩转大数据系列之日志收集神器 Flume Author:Cris 1. Flume 概述 1.1 什么是 ...

  3. 2017年,这两个大数据岗位一定会火!

    讨论哪个大数据岗位会火之前,我们先来简单的分析一下大数据领域的行情,这里重点说一下当前的情况. 2016年,互联网行业遇到了资本寒冬,抛开大公司不说,一些中小型的公司不断的缩减预算,因为很难融到钱. ...

  4. 大数据岗位薪资了解一下~

    大数据是IT界的行业术语,本名叫巨量数据集合.大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优 ...

  5. 实习证明| 大数据在线实习项目意义

    实习,在实践中学习,任何的知识源于实践,归于实践,最终也要通过实践进行检验,它是衔接学生在校学习与步入社会两个阶段的重要桥梁.一个好的实习机会,会帮助学生积累工作经验.验证职业选择.提升综合素质.但是 ...

  6. 大数据产品经理python_大数据岗位要求之数据产品经理

    继上篇介绍了数据分析师岗位的要求,这篇介绍数据产品经理的岗位要求(距上篇的更新时间有点久),还是先从几个大厂数据产品经理原始的岗位要求看起. 滴滴 1.本科以上学历: 2.2年以上数据分析.数据产品等 ...

  7. 大数据在线实习项目能收获什么呢?

    大数据在线实习项目提供在线大数据项目,参与真实企业项目,可提供实习证明. 项目实习过程会根据项目背景.项目目标.项目数据来逐一展开,一个项目的项目周期大概为4周时间,同时也可以根据自身时间条件来调整. ...

  8. 大数据行业年薪几十万,这些大数据岗位薪资了解一下

    大数据是IT界的行业术语,本名叫巨量数据集合.大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需要新处理模式才能具有更强的决策力.洞察发现力和流程优化 ...

  9. 大数据岗位校招Spark面试总结

    Hive 面试总结传送门:大数据岗位校招Hive面试总结 Hadoop 面试总结传送门: 大数据岗位校招Hadoop面试总结 继上一篇Hive相关的面试总结后,本篇总结下Spark相关的问题~ 1.S ...

最新文章

  1. 有 Bug 不会调试 ? 这篇文章很详细 !
  2. 机器学习中的数学意义
  3. HDU1061-Rightmost Digit(高速功率模)
  4. WPF的转换器中使用Brush应注意问题
  5. 将字符串中的html标签编译,将字符串中的HTML标签包含的内容移除
  6. LG卖楼进行时:价值87.7亿元的双子座大厦将出手
  7. 循环中的continue功能
  8. HTML示例07---图像与超链接
  9. python报错Nonetype object is not iterable
  10. Android HttpClient用法
  11. python交通流预测算法_一种高速公路交通流预测方法与流程
  12. matlab怎么把弧度换成度,matlab弧度与角度转换
  13. zuma族蚂网优化日志:SEO网站跳出率
  14. EA建模-绘制活动图
  15. 51NOD 1072 Wythoff Game
  16. 2022年长沙初级会计考试模拟题及答案
  17. 西门子标准报文1常用_深入学习PROFIdrive驱动控制协议(1)
  18. HTML和CSS内容总结
  19. C中字符串的几种定义方法及说明
  20. 【Qt学习】04 信号-槽 子窗口向主窗口传递参数

热门文章

  1. 虚拟机桥接模式下连接网络失败解决
  2. 自用工具 Unity 小地图
  3. 希望所有程序员的世界里,永远没有BUG
  4. 无人机的微分平坦性详细推导+Mini snap
  5. 毕达哥拉斯三元组及本原毕达哥拉斯三元组
  6. JavaSE 第三章 流程控制语句方法定义 笔记
  7. 假设你正在爬楼梯。需要 n 阶你才能到达楼顶。每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?
  8. Azure Active Directory Powershell命令创建一个application以及App需要的权限
  9. 洛谷 CF311B Cats Transport
  10. P15~P19 分支和循环