SparkStreaming入门及例子
看书大概了解了下Streaming的原理,但是木有动过手啊。。。万事开头难啊,一个wordcount 2小时怎么都运行不出结果。是我太蠢了,好了言归正传。
SparkStreaming是一个批处理的流式计算框架,适合处理实时数据与历史数据混合处理的场景(比如,你用streaming将实时数据读入处理,再使用sparkSQL提取历史数据,与之关联处理)。Spark Streaming将数据流以时间片为单位分割形成RDD,使用RDD操作处理每一块数据,没块数据都会生成一个spark JOB进行处理,最终以批处理方式处理每个时间片的数据。(多的就不解释了,百度就好了~)
首先确保你安装了hadoop和spark,在IDEA中也已入来了相应jar包。
写吧- -
新手要注意红框部分,spark官网上给的例子是调用socketFileStream方法,这是通过socket连接远程的,倘若只在本机上测试学习,就用textFileStream读取本地文件路径,没错是路径不是文件,因为sparkStreaming是处理实时数据的,倘若直接指定一个文件,输出后是无法得到结果的。所以新建了个路径,在这里设置了Seconds(20)每20秒读取一次。随后run一下。
启动后,将准备好的文件cp到这个路径下,20秒过后结果就出来了,模拟了下实时数据。结束。
SparkStreaming入门及例子相关推荐
- 基于vue-cli、elementUI的Vue超简单入门小例子
基于vue-cli.elementUI的Vue超简单入门小例子 这个例子还是比较简单的,独立完成后,能大概知道vue是干嘛的,可以写个todoList的小例子. 开始写例子之前,先对环境的部署做点简单 ...
- android php实战,android编程开发入门实战例子–hello word
android开发入门实战编程例子–hello word 1.打开Eclipse,选择菜单File->New->Other,打开新建对话框.选择Android Project后,点击Nex ...
- DMETL快速入门小例子
※DMETL的使用通常可以分为五个主要步骤:创建数据源.创建工程. 设计转换.设计作业和查看运行日志五个步骤. 下面以一个示例说明上述过程,该示例的功能是将BOOKSHOP示例库中 的EMPLOYEE ...
- IBATIS入门小例子
一个简单的iBatis入门例子,用ORACLE和Java测试 目录结构: 1.导入iBatis和oracle驱动. 2.创建类Person.java package com.ibeats; impor ...
- Python爬虫入门学习例子之煎蛋网(福利哦)
初学Python爬虫,学习资料是这篇博客:Python爬虫入门教程 经过前边两个例子(糗事百科爬虫和百度贴吧爬虫)的学习,我自己写了一个练习的例子:爬煎蛋网的妹子图,福利哦(*^__^*) #煎蛋网爬 ...
- Windows下以Local模式调试SparkStreaming的WordCount例子
1.下载Windows版的NetCat https://eternallybored.org/misc/netcat/ 2.启动NetCat nc -l -p 9999 3.将SAPRK_HOME\c ...
- Netty入门官方例子
学习分布式,正好看到Netty 是一个基于NIO的客户.服务器端编程框架,所以本着学习的态度去官网看了一下,官网例子,本着以后可以翻出来再看看的心态,把官网的第一个例子贴出来,也希望自己以后有一个可以 ...
- ice库c语言例子,很不多的ICE架构入门学习例子
虽然使用传统的SOCKET编程,我们可以更为清楚程序的性能,能够更直接的操控SOCKET的设置,比如发送超时时间,接受BUFFER的大小,以及进行自己的协议加密.但是由于其调试成本较高,且不易于分布式 ...
- python gui入门的例子_Python GUI编程之Tkinter入门之道
相信刚学习使用Python进行GUI编程的时候,肯定都会听过Tkinter,毕竟是standard Python interface to the Tk GUI toolkit.用来写一些小程序还是很 ...
最新文章
- Effective java 系列之更优雅的关闭资源-try-with-resources
- shiro系列一、认识shiro
- 2017寒假练习题解 第四周 2.6-2.12
- 学习面试题Day08
- 梦想中的网络安全和内部协作
- C#:invoke 与 BeginInvoke使用区别
- 牛客网暑期ACM多校训练营(第一场)
- 【LeetCode笔记】20.有效的括号(Java、栈) 21. 合并两个有序链表(Java)
- html 字体图标转换工具,字体图标的制作方式
- 图像处理总结:Canny边缘检测(二)
- SVN移植、合库、分库
- win10系统Nessus下载插件错误
- ios 保存图片到相册 崩溃_iOS保存图片到相册
- 《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记
- 怎么实现文字转语音朗读?这几个小技巧快来码住
- 软件测试的艺术 读书笔记完整版
- 关于MIDI键盘的服务对接
- transformer中相对位置编码理解
- matlab dae,matlab用ode15数值计算微分代数方程(DAE)的问题
- linux scsi相关的一些学习笔记
热门文章
- vim匹配数字及数量限制
- tf.placeholder在测试时带来的坑
- mysql主从复制运维_Mysql主从复制配置
- c 指定端口连接mysql_c++连接mysql(MYSQL C api使用)
- java第七章多线程_第七章 多线程
- 退出命令_Vim命令报错问题:无法用:wq命令保存并退出只读文件
- Java导出基础 用POI导出Excel
- 笔记-项目管理基础知识-项目管理办公室(PMO)
- Three.js中自定义控制几何体的点和面的属性
- Windows中将文件压缩成linux支持的tar.gz格式的压缩包