【大数据-课程】高途-天翼云侯圣文-Day3-实时计算原理解析
〇、老师及课程介绍
一、今日内容
二、实时计算理论解析
1、什么是实时计算
微批处理、流式处理、实时计算
水流和车流的例子
spark streaming就是一种微批处理,水满了才处理,进入下一个地方
流式计算:没有等待
深入:红绿灯交替的场景是微批处理,就不是流式计算了
水流的场景是流式计算时:直饮机,自来水直接可以饮用,出水的过程没有停一停等一等
其他:水流、视频流、
2、数据处理的四大概念
实时:微批处理或流式处理,20%,要求高,trouble shooting比较难
离线:80%的工作量
3、实时处理的价值
例如:送餐
4、应用场景:风控、欺诈、反欺诈
三、批处理框架比较
1、三种框架
2、storm发展历程
storm基于推特的storm自研产生
不流行的原因:开发语言不常用,准确性低,吞吐能力
阿里基于java重现,开发了jstorm
3、Spark Streaming的发展历程
为了解决准确性问题,以及吞吐量提升的问题
由流处理,转为微批处理语言
4、flink的发展历程
欧洲,德国柏林的小松鼠
5、性能对比
四、Flink介绍
1、flink在阿里的应用
2、技术栈
云计算节省成本,例如喝牛奶
流批一体,可以实现流处理,也可以实现批处理
3、适用于所有人的编程模型
越往上,越方便,越高效
越到底层,越易于troubleshooting
4、Flink核心内容-四个顶梁柱
查询状态
水印标签就是等待的时间,为了解决网络延迟带来的影响-相当于黄灯
5、无界数据流中的有限数据集
现象&技术方式-分段数汽车
数据或时间到了触发计算(汽车通行)
五、实战技术
1、技术和生活举例了解三个内容
固态水变液态水
sink:下沉
2、source
MySQL构成数据源
3、transform
通过水印标签watermark,实现了准确性
事件时间、摄入时间、处理时间
事件时间是客户端发生的时间
摄入时间是处理节点接收到的时间
处理时间是服务开始处理的时间
4、sink,把数据推送给谁
5、其他
val=value,是常量
var=variable,是变量
6、课程内容
【大数据-课程】高途-天翼云侯圣文-Day3-实时计算原理解析相关推荐
- 【大数据-课程】高途-天翼云侯圣文-Day2:离线数仓搭建分解
一.内容介绍 昨日福利:大数据反杀熟 今日:数据看板 离线分析及DW数据仓库 明日:实时计算框架及全流程 一.数仓定义及演进史 1.概念 生活中解答 2.数据仓库的理解 对比商品仓库 3.数仓分层内容 ...
- 不错的大数据课程体系(感谢某机构,希望不属于侵权)
2019独角兽企业重金招聘Python工程师标准>>> 阶段一.大数据.云计算 - Hadoop大数据开发技术 课程一.大数据运维之Linux基础 本部分是基础课程,帮大家进入大数据 ...
- 精华 | 恩墨学院侯圣文:大数据时代下的 DBA 该何去何从?
嘉宾演讲视频 Guest Video 温馨提示: 本视频时长57分02秒,建议在 WIFI 下观看. 第七届数据技术嘉年华于 2017年11月17日-18日在北京丽都皇冠假日酒店胜利召开,全国各地技术 ...
- 云计算和大数据课程开课简介
云计算和大数据课程开课简介 前言:小编今年还是大学的学生,这一学期学校开了有关于云计算.大数据.以及大数据仓库方面的课程,写这一系列的博客真正的意义并不在于说小编有学的多好(小编从小就是一个学渣), ...
- 2019大数据课程_根据数据,2019年最佳免费在线课程
2019大数据课程 As we do each year, Class Central has tallied the best courses of the previous year, based ...
- 2015年《大数据》高被引论文Top10文章No.7——大数据机器学习系统研究进展(上)...
2015年<大数据>高被引论文Top10文章展示 [编者按]本刊将把2015年<大数据>高被引论文Top10的文章陆续发布,欢迎大家关注!本文为高被引Top10论文的No.7, ...
- 大数据课程——Spark SQL
大数据课程--Spark SQL 实验内容以及要求 现有一份汽车销售记录(文件名:Cars.csv),销售记录包括时间.地点.邮政编码.车辆类型等信息,每条记录信息包含39项数据项.按步骤完成如下 ...
- 大数据课程体系-学习笔记概要
目录 目录 大数据课程体系 简介 学习阶段不定时更新 大数据课程体系 简介 作为一名物联网工程专业的学生,对于大数据有着不同寻常的热情,在有了一定的Android基础和J2EE基础后,希望学习更多的数 ...
- 打包带走极客时间大数据课程的正确姿势
"如何持续学习大数据 ,实现高效进阶?" 经常有读者让我推荐学习资源,非常开心大家能一直保持学习的习惯.其实不仅仅是大数据工程师需要学习大数据,每个软件工程师都应该学习一些大数据知 ...
最新文章
- Redhat 释放cached 内存
- 数据结构(C语言实现)勘误
- QM模块常见检验分类术语
- Elasticsearch对垒8大竞品技术
- *p++和*(p++)的区别_同是华为顶级旗舰,P系和Mate系谁最值得购买?明白这点很重要!...
- 信息学奥赛一本通 1033:计算线段长度 | OpenJudge NOI 1.3 16
- 苹果内部文件曝光:iPhone SE3以外,还有大惊喜...
- 事件---------2
- java 时间格式化_还在用SimpleDateFormat格式化时间?小心经理锤你
- 怎么修改asp文件上传大小限制?
- 控制器Ryu+Mininet完成集线器、自学习交换机、流量监控实例开发
- SmartToast
- execl筛选去重_excel表格如何去除重复数据进行筛选
- 熬了一夜!我用Python做了一个网站,帮小姐姐生成漫画头像
- 艺赛旗(RPA)python 的 tkinter 进度条的实现
- 2017计算机研究生专业排名,2017年USNews美国大学计算机硕士研究生专业排名TOP110...
- 身份证号的验证与解析
- 什么是蛮力攻击,您能做什么来防止这些攻击的发生?
- hbw-utils - 关于hutool的parseInt方法
- STM32f103ZET6引脚通道(ADC和TIM)
热门文章
- 怎么在淘宝主页添加直达微博链接
- WM有约(三):下一次是什么时候?
- 采集中常见HTML标签
- 超级玛丽java下载_超级玛丽java源码 非本人原创 - 下载 - 搜珍网
- python14张图下载_14张思维导图带你征服Python编程
- 河北中职计算机哪个学校好,河北十大中职学校排行榜
- c语言题库计算机专业考研,2020年北京信息科技大学计算机学院考研真题试卷及试题答案,数据结构与C语言程序设计考研试题下载...
- SpringMVC之拦截器和文件上传下载
- Ffmpeg实例,视频的倒放
- RK3568行业平板人脸识别解决方案