〇、老师及课程介绍

一、今日内容

二、实时计算理论解析

1、什么是实时计算

微批处理、流式处理、实时计算

水流和车流的例子

spark streaming就是一种微批处理,水满了才处理,进入下一个地方

流式计算:没有等待

深入:红绿灯交替的场景是微批处理,就不是流式计算了

水流的场景是流式计算时:直饮机,自来水直接可以饮用,出水的过程没有停一停等一等

其他:水流、视频流、

2、数据处理的四大概念

实时:微批处理或流式处理,20%,要求高,trouble shooting比较难

离线:80%的工作量

3、实时处理的价值

例如:送餐

4、应用场景:风控、欺诈、反欺诈

三、批处理框架比较

1、三种框架

2、storm发展历程

storm基于推特的storm自研产生

不流行的原因:开发语言不常用,准确性低,吞吐能力

阿里基于java重现,开发了jstorm

3、Spark Streaming的发展历程

为了解决准确性问题,以及吞吐量提升的问题

由流处理,转为微批处理语言

4、flink的发展历程

欧洲,德国柏林的小松鼠

5、性能对比

四、Flink介绍

1、flink在阿里的应用

2、技术栈

云计算节省成本,例如喝牛奶

流批一体,可以实现流处理,也可以实现批处理

3、适用于所有人的编程模型

越往上,越方便,越高效

越到底层,越易于troubleshooting

4、Flink核心内容-四个顶梁柱

查询状态

水印标签就是等待的时间,为了解决网络延迟带来的影响-相当于黄灯

5、无界数据流中的有限数据集

现象&技术方式-分段数汽车

数据或时间到了触发计算(汽车通行)

五、实战技术

1、技术和生活举例了解三个内容

固态水变液态水

sink:下沉

2、source

MySQL构成数据源

3、transform

通过水印标签watermark,实现了准确性

事件时间、摄入时间、处理时间

事件时间是客户端发生的时间

摄入时间是处理节点接收到的时间

处理时间是服务开始处理的时间

4、sink,把数据推送给谁

5、其他

val=value,是常量

var=variable,是变量

6、课程内容

【大数据-课程】高途-天翼云侯圣文-Day3-实时计算原理解析相关推荐

  1. 【大数据-课程】高途-天翼云侯圣文-Day2:离线数仓搭建分解

    一.内容介绍 昨日福利:大数据反杀熟 今日:数据看板 离线分析及DW数据仓库 明日:实时计算框架及全流程 一.数仓定义及演进史 1.概念 生活中解答 2.数据仓库的理解 对比商品仓库 3.数仓分层内容 ...

  2. 不错的大数据课程体系(感谢某机构,希望不属于侵权)

    2019独角兽企业重金招聘Python工程师标准>>> 阶段一.大数据.云计算 - Hadoop大数据开发技术 课程一.大数据运维之Linux基础 本部分是基础课程,帮大家进入大数据 ...

  3. 精华 | 恩墨学院侯圣文:大数据时代下的 DBA 该何去何从?

    嘉宾演讲视频 Guest Video 温馨提示: 本视频时长57分02秒,建议在 WIFI 下观看. 第七届数据技术嘉年华于 2017年11月17日-18日在北京丽都皇冠假日酒店胜利召开,全国各地技术 ...

  4. 云计算和大数据课程开课简介

    云计算和大数据课程开课简介  前言:小编今年还是大学的学生,这一学期学校开了有关于云计算.大数据.以及大数据仓库方面的课程,写这一系列的博客真正的意义并不在于说小编有学的多好(小编从小就是一个学渣), ...

  5. 2019大数据课程_根据数据,2019年最佳免费在线课程

    2019大数据课程 As we do each year, Class Central has tallied the best courses of the previous year, based ...

  6. 2015年《大数据》高被引论文Top10文章No.7——大数据机器学习系统研究进展(上)...

    2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.7, ...

  7. 大数据课程——Spark SQL

    大数据课程--Spark SQL   实验内容以及要求 现有一份汽车销售记录(文件名:Cars.csv),销售记录包括时间.地点.邮政编码.车辆类型等信息,每条记录信息包含39项数据项.按步骤完成如下 ...

  8. 大数据课程体系-学习笔记概要

    目录 目录 大数据课程体系 简介 学习阶段不定时更新 大数据课程体系 简介 作为一名物联网工程专业的学生,对于大数据有着不同寻常的热情,在有了一定的Android基础和J2EE基础后,希望学习更多的数 ...

  9. 打包带走极客时间大数据课程的正确姿势

    "如何持续学习大数据 ,实现高效进阶?" 经常有读者让我推荐学习资源,非常开心大家能一直保持学习的习惯.其实不仅仅是大数据工程师需要学习大数据,每个软件工程师都应该学习一些大数据知 ...

最新文章

  1. Redhat 释放cached 内存
  2. 数据结构(C语言实现)勘误
  3. QM模块常见检验分类术语
  4. Elasticsearch对垒8大竞品技术
  5. *p++和*(p++)的区别_同是华为顶级旗舰,P系和Mate系谁最值得购买?明白这点很重要!...
  6. 信息学奥赛一本通 1033:计算线段长度 | OpenJudge NOI 1.3 16
  7. 苹果内部文件曝光:iPhone SE3以外,还有大惊喜...
  8. 事件---------2
  9. java 时间格式化_还在用SimpleDateFormat格式化时间?小心经理锤你
  10. 怎么修改asp文件上传大小限制?
  11. 控制器Ryu+Mininet完成集线器、自学习交换机、流量监控实例开发
  12. SmartToast
  13. execl筛选去重_excel表格如何去除重复数据进行筛选
  14. 熬了一夜!我用Python做了一个网站,帮小姐姐生成漫画头像
  15. 艺赛旗(RPA)python 的 tkinter 进度条的实现
  16. 2017计算机研究生专业排名,2017年USNews美国大学计算机硕士研究生专业排名TOP110...
  17. 身份证号的验证与解析
  18. 什么是蛮力攻击,您能做什么来防止这些攻击的发生?
  19. hbw-utils - 关于hutool的parseInt方法
  20. STM32f103ZET6引脚通道(ADC和TIM)

热门文章

  1. 怎么在淘宝主页添加直达微博链接
  2. WM有约(三):下一次是什么时候?
  3. 采集中常见HTML标签
  4. 超级玛丽java下载_超级玛丽java源码 非本人原创 - 下载 - 搜珍网
  5. python14张图下载_14张思维导图带你征服Python编程
  6. 河北中职计算机哪个学校好,河北十大中职学校排行榜
  7. c语言题库计算机专业考研,2020年北京信息科技大学计算机学院考研真题试卷及试题答案,数据结构与C语言程序设计考研试题下载...
  8. SpringMVC之拦截器和文件上传下载
  9. Ffmpeg实例,视频的倒放
  10. RK3568行业平板人脸识别解决方案