简介: 欢迎钉钉扫描文章底部二维码进入 EMR Studio 用户交流群 直接和讲师交流讨论~ 点击以下链接直接观看直播回放:https://developer.aliyun.com/live/247106

开源大数据社区 & 阿里云 EMR 系列直播 第十二期

主题:Flink on Zeppelin 流计算处理最佳实践

讲师:简锋,阿里云 EMR 数据开发平台 负责人

内容框架:

  • 大数据概览
  • Flink 学习框架
  • EMR Studio 上的流计算最佳实践
  • 演示

直播回放:扫描文章底部二维码加入钉群观看回放,或进入链接https://developer.aliyun.com/live/247106

一、大数据概览

  • 大数据处理 ETL (Data  → Data)
  • 大数据分析 BI   (Data  →  Dashboard)
  • 机器学习    AI   (Data  →  Model)

二、Flink 学习框架

Flink 要点

  • Stateful
  • Time
  • Flink Architecture
  • Flink API
  • Flink Configuration
  • Flink Log

Stateful:

  • Why

• 流计算的及时性

• 流计算的 unbounded

  • When

• Window

• Join

• Pattern

  • How

• statebackend

Time

  • Event time
  • Processing time
  • Watermark

Flink Architecture

Flink API

Flink Configuration

  • Cluster Configuration
  • Job Configuration
  • Statebackend
  • Resource Manager
  • SQL/Python

参考文档:https://ci.apache.org/projects/flink/flink-docs-release-1.13/docs/deployment/config/

Flink Log

三、EMR Studio 上的流计算最佳实践

EMR Studio 特性:

  • 兼容开源组件
    EMR Studio 在开源软件 Apache Zeppelin,Jupyter Notebook, Apache Airflow 的基础上优化了做了优化和增强。

  • 支持连接多个集群
  • 适配多个计算引擎
  • 交互式开发 + 作业调度无缝衔接
  • 适用多种大数据应用场景
  • 计算存储分离

Flink Clients

Flink on Zeppelin (Phase 1) - Interactive Flink Client

Flink on Zeppelin (Phase 2) - Interactive JobManager

Flinkon Zeppelin 主要 Feature

四、演示

具体产品介绍和演示,可以点击以下链接直接观看回放:

https://developer.aliyun.com/live/247106

原文链接

本文为阿里云原创内容,未经允许不得转载。

Flink on Zeppelin 流计算处理最佳实践相关推荐

  1. 腾讯基于 Flink 的实时流计算平台演进之路

    原文地址:https://www.infoq.cn/article/TjDeQDJQpKZ*NpG71pRW 大家好,我是来自腾讯大数据团队的杨华(vinoyang),很高兴能够参加这次北京的 QCo ...

  2. 基于Flink+ClickHouse构建实时游戏数据分析最佳实践

    简介:本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算.云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务. 直达 ...

  3. 实时计算的最佳实践:基于表格存储和Blink的大数据实时计算

    表格存储: 数据存储和数据消费All in one 表格存储(Table Store)是阿里云自研的NoSQL多模型数据库,提供PB级结构化数据存储.千万TPS以及毫秒级延迟的服务能力.在实时计算场景 ...

  4. apache geode项目结构_Apache Flink-基于Java项目模板创建Flink应用(流计算和批计算)...

    Apache Flink创建模板项目有2种方式: 1. 通过Maven archetype命令创建: 2. 通过Flink 提供的Quickstart shell脚本创建: 关于Apache Flin ...

  5. ajax 请求二进制流 图片 文件 XMLHttpRequest 请求并处理二进制流数据 之最佳实践

    本文转自一位高人的博客:情郎 Blog 写在前面 :从提出需求到完美的解决问题,实现过程是曲折的. 需求:在前(web client)后(Restful Service)端完全解耦的模式框架下,web ...

  6. 【Flink 监控系列】Flink on yarn 任务实时监控最佳实践(Prometheus + Grafana)打造企业级监控方案

    我们都知道 Flink 任务是一个 7*24 小时不停运行的任务,所以对于任务的实时监控就显得尤为重要,因为任务运行的状态对于我们来说是一个黑盒,比如任务是否挂掉,是否存在反压,使用的内存,CPU 等 ...

  7. Flink SQL 1.11 新功能与最佳实践

    #2020云栖大会#阿里云海量offer来啦!投简历.赢阿里云限量礼品及阿里云ACA认证免费考试资格!>>> 整理者:陈婧敏(清樾) 本文整理自 Apache Flink PMC,阿 ...

  8. Flink JDBC Connector:Flink 与数据库集成最佳实践

    整理:陈政羽(Flink 社区志愿者) 摘要:Flink 1.11 引入了 CDC,在此基础上, JDBC Connector 也发生比较大的变化,本文由 Apache Flink Contribut ...

  9. 数据湖:流计算处理框架Flink概述

    系列专题:数据湖系列文章 大数据计算引擎分为离线计算和实时计算,离线计算就是我们通常说的批计算,代表是Hadoop MapReduce.Hive等大数据技术.实时计算也被称作流计算,代表是Storm. ...

最新文章

  1. 2022-2028年中国纤维增强聚合物行业市场调查研究及发展前景规划报告
  2. Microsoft Enterprise Library 4.0 for Visual Studio 2008
  3. 设计模式-设计原则(Design Principle)
  4. Centos 用户组管理
  5. Python过渡性模块重载(递归重载模块)
  6. mysql5.5从零开始_【MySQL函数】MySQL 5.5从零开始学第六章
  7. 使用SQL存储过程有什么好处 用视图有什么好处
  8. FastGitHub for Mac(GitHub下载扩展工具)
  9. 安装ADB Interface驱动
  10. 数据库与开源编译器框架LLVM
  11. 关于ajax同步状态及sucess,complete的顺序的理解
  12. 少女长期与宠物睡觉 遭“宠物虫”噬骨导致瘫痪
  13. 湖南大学计算机考试题,湖南大学计算机组成原理期中考试题库
  14. R语言二项分布(The Binomial Distribution)
  15. AUTOSAR架构的故事(干货)
  16. unity3dui中图片加不上_Unity3d中设置UISprite图片灰显方法
  17. 一个简单的个人介绍html网页制作
  18. 基于 Vuepress 搭建个人博客,文章详细,助你快速上手
  19. QSocketNotifier 解读
  20. PostgreSQL + Postgis

热门文章

  1. 全国计算机二级哪几门比较热,【热】全国计算机二级office难吗
  2. 用php创建一相册文件_php文件创建
  3. vue变量传值_VUE 学习——父组件传值给子组件
  4. post获取重定向的链接 python_欧美音乐网站Python爬虫项目实战
  5. run till exit from #0_华为认证hcip H13821 v2.0云服务考试真题每日一练(一)
  6. python换循环颜色_python – 增加matplotlib颜色循环
  7. python去掉空白行_python去掉空白行的多种实现代码
  8. linux下数据库时间格式,Java编程时间格式与数据库中时间格式转化
  9. zabbix监控pppoe线路_Zabbix 完整的监控流程
  10. 清华大学迎来外籍院长!