Spark Streaming之Window Operations

官网:http://spark.apache.org/docs/latest/streaming-programming-guide.html

IDEA操作

package g5.learningimport org.apache.spark.SparkConf
import org.apache.spark.streaming.{Seconds, StreamingContext}import scala.collection.mutable.ListBufferobject WindowApp {def main(args: Array[String]): Unit = {//准备工作val conf = new SparkConf().setMaster("local[2]").setAppName("WindowApp")val ssc = new StreamingContext(conf, Seconds(10))//业务逻辑val lines = ssc.socketTextStream("hadoop001", 9999)lines.flatMap(_.split(",")).map((_,1)).reduceByKeyAndWindow((a:Int,b:Int) => (a + b), Seconds(10), Seconds(10)).print()//streaming的启动ssc.start() // Start the computationssc.awaitTermination() // Wait for the computation to terminate}
}

注意:

1.数据可以交叉,也可以不交叉,主要是看你配置的参数
window length - The duration(持续) of the window (3 in the figure).
sliding interval - The interval at which the window operation is performed (2 in the figure).
2.这里涉及到3个时间参数,是有一定的关系的
These two parameters must be multiples of the batch(一批) interval of the source DStream (1 in the figure).
window length和sliding interval必须是(conf, Seconds(10))这个时间参数的整数倍

Spark Streaming之Window Operations操作和解析相关推荐

  1. 通过Spark Streaming的window操作实战模拟热点搜索词案例实战

    本博文主要内容包括: 1.在线热点搜索词实现解析 2.SparkStreaming 利用reduceByKeyAndWindow实现在线热点搜索词实战 一:在线热点搜索词实现解析 背景描述:在社交网络 ...

  2. Spark Streaming的窗口操作

    2019独角兽企业重金招聘Python工程师标准>>> Spark Streaming的窗口操作 博客分类: spark Spark Streaming的Window Operati ...

  3. 图解大数据 | 流式数据处理-Spark Streaming

    作者:韩信子@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/84 本文地址:http://www.showmeai.tech/article-det ...

  4. Spark详解(十二):Spark Streaming原理和实现

    1 简介 SparkStreaming是Spark核心API的一个扩展,具有高吞吐量和容错能力的实时流数据处理系统,可以对多种数据源(如Kdfka.Flume.Twitter.Zero和TCP 套接字 ...

  5. Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍

    [注]该系列文章以及使用到安装包/测试数据 可以在<倾情大奉送--Spark入门实战系列>获取 1.Spark Streaming简介 1.1 概述 Spark Streaming 是Sp ...

  6. .Spark Streaming(上)--实时流计算Spark Streaming原理介

    Spark入门实战系列--7.Spark Streaming(上)--实时流计算Spark Streaming原理介绍 http://www.cnblogs.com/shishanyuan/p/474 ...

  7. 021 Spark Streaming

    1.简介 Spark Streaming抽象.架构与原理 StreamingContext 是 Spark Streaming 程序的入口,其指定sparkConf.确定DStream生成的间隔.设定 ...

  8. sparksteaming---实时流计算Spark Streaming原理介绍

    来源:http://www.cnblogs.com/shishanyuan/p/4747735.html 1.Spark Streaming简介 1.1 概述 Spark Streaming 是Spa ...

  9. 实验十八 Spark实验:Spark Streaming

    实验指导: 18.1 实验目的 1. 了解Spark Streaming版本的WordCount和MapReduce版本的WordCount的区别: 2. 理解Spark Streaming的工作流程 ...

最新文章

  1. Hibernate学习笔记
  2. CSS设置动态超链接
  3. Oracle 如何修改列的数据类型
  4. linux系统安装jdk及配置环境变量
  5. 数字与企鹅的战争,看周红衣的高明之处
  6. 微信h5网页关闭分享以及关闭当前页面
  7. python初学 数据分叉情况下的函数递归
  8. python中random库中shuffle_[宜配屋]听图阁 - 详解Python中打乱列表顺序random.shuffle()的使用方法...
  9. python使用flask模块和前端交互基础
  10. 数据库安全关键技术之数据库脱敏技术详解
  11. 您有新的订单提示音在线试听_iPhone修改微信提示音,支持全部机型,无需越狱...
  12. 【Call Me Maybe】MMD镜头+动作打包下载.zip
  13. CodeForces-1040B Shashlik Cooking(贪心)
  14. 微软商店打不开解决方法错误代码0x80131500
  15. happen-before与volatile、final
  16. 【JavaSE】类和对象
  17. Service START_NOT_STICKY、START_STICKY
  18. PTA 7-191 百钱百鸡
  19. 软件功能测试包含了哪些测试项目?功能测试报告收费标准
  20. Unity2020Video player发布后无法播放视频问题

热门文章

  1. nginx访问控制allow、deny(ngx_http_access_module)
  2. 【公众号】微信第三方登录(静默授权和非静默授权)(具体代码:U盘 新浪云SAE)...
  3. Android一种常见的布局困扰
  4. 断路器监控(Hystrix Dashboard)
  5. typora工具的使用方法-一款非常适合程序员的工具
  6. 数据库授予用户增删改查的权限的语句_mysql数据库终端上的增删改查及权限等相关操作...
  7. OC中类别、扩展、协议与托付
  8. android:#FFFFFFFF 颜色码解析
  9. python tkinter界面 控件位置随窗体自动调整适应_如何实现python tkinter控件随窗口变化?...
  10. verilog实现多周期处理器之——(一)基本概念以及总体框架