Flink has the special classes DataSet and DataStream to represent data in a program. You can think of them as immutable(不可变的) collections of data that can contain duplicates(可以重复).
In the case of DataSet the data is finite(对于DataSet 数据是有界的,批处理使用)
while for a DataStream the number of elements can be unbounded(然而对于DataStream数据是无界的,流处理使用).

immutable:
These collections differ from regular Java collections in some key ways. First, they are immutable, meaning that once they are created you cannot add or remove elements. You can also not simply inspect the elements inside.

A collection is initially created by adding a source in a Flink program and new collections are derived from these by transforming them using API methods such as map, filter and so on.

DataSet and DataStream相关推荐

  1. Flink 基本原理与生产实践分享【入门必读,概念清晰】

    Flink 基本原理与生产实践分享[入门必读,概念清晰] https://zh.wikipedia.org/zh-hans/Apache_Flink Apache Flink是由Apache软件基金会 ...

  2. Apache Flink vs Apache Spark——感觉二者是互相抄袭啊 看谁的好就抄过来 Flink支持在runtime中的有环数据流,这样表示机器学习算法更有效而且更有效率...

    Apache Flink是什么 Flink是一款新的大数据处理引擎,目标是统一不同来源的数据处理.这个目标看起来和Spark和类似.没错,Flink也在尝试解决 Spark在解决的问题.这两套系统都在 ...

  3. 使用flink Table Sql api来构建批量和流式应用(2)Table API概述

    从flink的官方文档,我们知道flink的编程模型分为四层,sql层是最高层的api,Table api是中间层,DataStream/DataSet Api 是核心,stateful Stream ...

  4. 学习笔记Flink(四)—— Flink基础API及核心数据结构

    一.Flink基础API-Flink编程的基本概念 1.1.Flink程序 Flink 程序是实现了分布式集合转换(例如过滤.映射.更新状态.join.分组.定义窗口.聚合)的规范化程序. 集合初始创 ...

  5. Apache Flink 零基础入门(十八)Flink Table APISQL

    什么是Flink关系型API? 虽然Flink已经支持了DataSet和DataStream API,但是有没有一种更好的方式去编程,而不用关心具体的API实现?不需要去了解Java和Scala的具体 ...

  6. 仅1年GitHub Star数翻倍,Flink 做了什么?

    阿里妹导读:Apache Flink 是公认的新一代开源大数据计算引擎,其流水线运行系统既可以执行批处理程序也可以执行流处理程序.目前,Flink 已成为 Apache 基金会和 GitHub 社区最 ...

  7. Flink的Table API 与SQL介绍及调用

    1 概述    DataSetAPI和DateStreamAPI是基于整个Flink的运行时环境做操作处理的,Table API和SQL是在DateStreamAPI上又包了一层.对于新版本的Blin ...

  8. Flink 流批一体的实践与探索

    自 Google Dataflow 模型被提出以来,流批一体就成为分布式计算引擎最为主流的发展趋势.流批一体意味着计算引擎同时具备流计算的低延迟和批计算的高吞吐高稳定性,提供统一编程接口开发两种场景的 ...

  9. 如何在 Apache Flink 中使用 Python API?

    本文根据 Apache Flink 系列直播课程整理而成,由 Apache Flink PMC,阿里巴巴高级技术专家 孙金城 分享.重点为大家介绍 Flink Python API 的现状及未来规划, ...

最新文章

  1. mysql查询数据库desc_数据库查询DESC
  2. Response.ContentType所有类型例举
  3. java查询数据库的方式_Java连接各种数据库方式速查表
  4. unity3d 随机物体生成器 工具
  5. JAVA EE 6 jar包集合_Java EE6将JSF facelets(xhtml)和ManagedBeans打包成JAR
  6. drawboard pdf拆分文件_掌握在线PDF拆分技巧,从此打开文件不再处于“加载中”...
  7. C++ IO库:cmd读写,字符串读写,文件读写,<<重载,标准输出
  8. Vuex 实战:如何在大规模 Vue 应用中组织 Vuex 代码 | 掘金技术征文
  9. html转换为jpg格式,JPG转换成HTML的两种方法
  10. Python告诉你咪蒙10w+文章标题的秘密
  11. [Linux] 非root安装Lefse软件及其数据分析
  12. 教你轻松查看QQ空间加密后的好友图片
  13. 信号与系统学习小窍门
  14. 如何用VB语言实现四连环游戏(重力四子棋)?
  15. 什么是设备管理系统,包括哪些内容?一文读懂
  16. 地产中介门店10用户桌面云方案
  17. 阿里云OSS 图片处理
  18. SeeDAO专访:11 个月 4 次低谷,一个 DAO 如何从停滞中重生?
  19. java文本写入方法(PrintStream,FileWriter,BufferedWriter)
  20. jquery的学习个人总结

热门文章

  1. 解决Shockwave flash在谷歌浏览器上崩溃的问题
  2. Activiti 监听器的配置使用
  3. 数据结构基础(11) --循环链表的设计与实现
  4. 数据仓库之电商数仓-- 1、用户行为数据采集
  5. Redis-集合(Set)基础
  6. hadoop3.0.3 SLS-Failed to create an AM
  7. 自适应图片大小的弹出窗口(3 中方法)
  8. Python 程序和 C 程序的整合
  9. redis-cli 常用命令
  10. 判断Linux系统是否被黑的方法