欢迎关注公众号——《数据三分钟》

一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。

从这一期开始,将分享一个新的系列——讲讲Flink菜鸟教程。Flink作为大数据实时计算引擎,受到了越来越多的关注和使用,它的高吞吐、低延迟、以及支持ExactlyOnce语义的优良特性,进一步扩大了自己的粉丝圈。随着社区的发展以及阿里巴巴对Blink(Flink的阿里巴巴版)的开源,Flink SQL的功能也逐步强大,越来越多的开发者已经选择从DataStream API和DataSet API转向了更为简单的SQL API,那么为什么要转向SQL API?主要有这几个原因:

第一就是好懂啊!SQL是一门真正的跨行业语言,而且学习成本较低,这里请允许我隆重介绍一下SQL发明人——埃德加·弗兰克·科德(英文:Edgar Frank "Ted" Codd)(1923年8月23日-2003年4月18日)是一位英国计算机科学家。他为关系型数据库理论做出了奠基性的贡献。他在IBM工作期间,首创了关系模型理论。他一生中为计算机科学做出了很多有价值的贡献,而关系模型,作为一个在数据库管理方面非常具有影响力的基础理论,仍然被认为是他最引人瞩目的成就。1981年,科德因在关系型数据库方面的贡献获得了图灵奖,图灵奖可称得上是计算机领域的诺贝尔奖了,所以把SQL作为Flink的最顶层API非常有利于开发者学习和应用。

第二是屏蔽底层原理!说白了,你只需要告诉引擎你要干啥?你想怎样?具体的实现统统由引擎来帮你搞定,这多爽啊,要知道在大数据领域光调优就能搞死人的。通过select、group by、insert这些指令组合就可以实现业务需求,就可以上手开发实时任务,轻轻松松走上实时开发的“巅峰”。

第三我觉得就是流批一体的大前提。因为从数据场景使用的本质上看,实时和离线是完全不同的。在Flink中,把实时数据源看作是无界数据流,而把离线数据源看作是实时数据源的一种特例,也就是有界数据流。但是呢,毕竟是两种天然不同的数据场景,因此Flink演化出了DataStream API和DataSet API专门for这两种情况,不过还好Flink SQL在API层面上真正统一了实时离线场景,是实现流批一体的关键所在。

本系列的分享呢,是结合笔者自己的学习过程和开发过程,用最最通俗易懂的话来聊聊Flink的底层原理,以及怎么用Flink来构建我们自己的实时任务,系列分享的知识大图如下:

Flink菜鸟教程(一)——从入门到开发相关推荐

  1. 2021年最新最全Flink系列教程_Flink快速入门(概述,安装部署)(一)(JianYi收藏)

    文章目录 引言 相关教程直通车: day01_Flink概述.安装部署和入门案例 今日目标 Flink概述 什么是批处理和流处理 为什么需要流计算 Flink的发展史 Flink的官方介绍 Flink ...

  2. python3菜鸟教程-Python3 快速入门教程

    Python3下载地址 python.org为python的官网,进去后如果是windows用户就先看一下自己的系统是32位的还是64位的,64位的下x86-64,32位的下x86,最好别下最新的,因 ...

  3. Flink菜鸟教程(二)——时间概念

     欢迎关注公众号--<数据三分钟> 一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人.还有面试指导和内推机会. 上一节说到,实时计算中的数据可以看成无 ...

  4. pyqt5菜鸟教程_[ PyQt入门教程 ] PyQt5信号与槽

    信号和槽是PyQt编程对象之间进行通信的机制.每个继承自QWideget的控件都支持信号与槽机制.信号发射时(发送请求),连接的槽函数就会自动执行(针对请求进行处理).本文主要讲述信号和槽最基本.最经 ...

  5. 『Python开发实战菜鸟教程』实战篇:爬虫快速入门——统计分析CSDN与博客园博客阅读数据

    文章目录 0x01:引子 首先介绍一下网络爬虫是什么,可以用来做什么? 这里简单探讨一下网络爬虫的合法性 正式进入爬虫实战前,需要我们了解下网页结构 HTML CSS JScript 写一个简单的 H ...

  6. python菜鸟基础教程-终于懂得python入门菜鸟教程

    Python语言是一种典型的脚本语言,简洁,语法约束少,接近人类语言.有丰富的数据结构,例如列表.字典.集合等.具有可移植性,支持面向过程和面向对象编程,并且开源.以下是小编为你整理的python入门 ...

  7. python基础教程菜鸟教程-终于懂得python入门菜鸟教程

    Python语言是一种典型的脚本语言,简洁,语法约束少,接近人类语言.有丰富的数据结构,例如列表.字典.集合等.具有可移植性,支持面向过程和面向对象编程,并且开源.以下是小编为你整理的python入门 ...

  8. 『Python开发实战菜鸟教程』工具篇:手把手教学使用VSCode开发Python

    文章目录: 0X01:引子 Python学习资料及开发工具介绍 0x02:实操 基于 Conda 的 Python 安装 VSCode 的安装使用 安装 插件管理按钮使用介绍 VSCode 如何管理项 ...

  9. python scrapy菜鸟教程_scrapy学习笔记(一)快速入门

    安装Scrapy Scrapy是一个高级的Python爬虫框架,它不仅包含了爬虫的特性,还可以方便的将爬虫数据保存到csv.json等文件中. 首先我们安装Scrapy. pip install sc ...

最新文章

  1. frps server端配置_Docker 快速搭建 mock-server
  2. python解决鸡兔同笼问题
  3. hdfs通过接口退出安全模式_Hadoop之HDFS简介
  4. 数据中心机房供电需求有哪些?供配电系统如何布置??
  5. 全球及中国印刷行业发展形势与十四五应用前景分析报告2022版
  6. 一图解明Android Studio项目文件结构各部分作用
  7. squid 的配置详解 (转)--SeriesI
  8. 【MySQL】ERROR 1046 (3D000):
  9. springboot--多环境
  10. GHOST常用参数详解,让你成为GHOST高手(转)
  11. 乐高机器人巡线C语言程序,乐高机器人巡线原理
  12. dns预获取(dns-prefetch)link rel="dns-prefetch"优化载入速度
  13. 3-产品经理学习笔记之产品经理的工作职责和能力模型
  14. Linux系统中关闭超线程,超线程加快Linux操作系统的速度怎么样?
  15. excel学习-选择性粘贴(转置+跳过空白单元格+运算)
  16. iOS Xcode:No account for team 5P2U9V6DNN.
  17. python寻峰,[LeetCode][Python]162. 寻找峰值
  18. JOOQ 踩坑和评价
  19. hzw的数列分块入门
  20. Hive元数据库中各个表的含义(十)

热门文章

  1. SX1278 LoRa通讯的频率设定
  2. 初入职场SVN使用教程,保姆级
  3. Filter内存马浅析
  4. AD10生成gerber文件的详细说明
  5. 天津政府应急系统之GIS一张图(arcgis api for flex)讲解(二)鹰眼模块
  6. JAVA实现100以内偶数和,奇数和,奇偶和
  7. uni-app 聊天对话滚动到最底部
  8. 《CMMI的五个级别》
  9. Jenkins中Changelog插件使用
  10. 关于短信验证码报错和解决问题