看书大概了解了下Streaming的原理,但是木有动过手啊。。。万事开头难啊,一个wordcount 2小时怎么都运行不出结果。是我太蠢了,好了言归正传。

SparkStreaming是一个批处理的流式计算框架,适合处理实时数据与历史数据混合处理的场景(比如,你用streaming将实时数据读入处理,再使用sparkSQL提取历史数据,与之关联处理)。Spark Streaming将数据流以时间片为单位分割形成RDD,使用RDD操作处理每一块数据,没块数据都会生成一个spark JOB进行处理,最终以批处理方式处理每个时间片的数据。(多的就不解释了,百度就好了~)

首先确保你安装了hadoop和spark,在IDEA中也已入来了相应jar包。

写吧- -

新手要注意红框部分,spark官网上给的例子是调用socketFileStream方法,这是通过socket连接远程的,倘若只在本机上测试学习,就用textFileStream读取本地文件路径,没错是路径不是文件,因为sparkStreaming是处理实时数据的,倘若直接指定一个文件,输出后是无法得到结果的。所以新建了个路径,在这里设置了Seconds(20)每20秒读取一次。随后run一下。

启动后,将准备好的文件cp到这个路径下,20秒过后结果就出来了,模拟了下实时数据。结束。

SparkStreaming入门及例子相关推荐

  1. 基于vue-cli、elementUI的Vue超简单入门小例子

    基于vue-cli.elementUI的Vue超简单入门小例子 这个例子还是比较简单的,独立完成后,能大概知道vue是干嘛的,可以写个todoList的小例子. 开始写例子之前,先对环境的部署做点简单 ...

  2. android php实战,android编程开发入门实战例子–hello word

    android开发入门实战编程例子–hello word 1.打开Eclipse,选择菜单File->New->Other,打开新建对话框.选择Android Project后,点击Nex ...

  3. DMETL快速入门小例子

    ※DMETL的使用通常可以分为五个主要步骤:创建数据源.创建工程. 设计转换.设计作业和查看运行日志五个步骤. 下面以一个示例说明上述过程,该示例的功能是将BOOKSHOP示例库中 的EMPLOYEE ...

  4. IBATIS入门小例子

    一个简单的iBatis入门例子,用ORACLE和Java测试 目录结构: 1.导入iBatis和oracle驱动. 2.创建类Person.java package com.ibeats; impor ...

  5. Python爬虫入门学习例子之煎蛋网(福利哦)

    初学Python爬虫,学习资料是这篇博客:Python爬虫入门教程 经过前边两个例子(糗事百科爬虫和百度贴吧爬虫)的学习,我自己写了一个练习的例子:爬煎蛋网的妹子图,福利哦(*^__^*) #煎蛋网爬 ...

  6. Windows下以Local模式调试SparkStreaming的WordCount例子

    1.下载Windows版的NetCat https://eternallybored.org/misc/netcat/ 2.启动NetCat nc -l -p 9999 3.将SAPRK_HOME\c ...

  7. Netty入门官方例子

    学习分布式,正好看到Netty 是一个基于NIO的客户.服务器端编程框架,所以本着学习的态度去官网看了一下,官网例子,本着以后可以翻出来再看看的心态,把官网的第一个例子贴出来,也希望自己以后有一个可以 ...

  8. ice库c语言例子,很不多的ICE架构入门学习例子

    虽然使用传统的SOCKET编程,我们可以更为清楚程序的性能,能够更直接的操控SOCKET的设置,比如发送超时时间,接受BUFFER的大小,以及进行自己的协议加密.但是由于其调试成本较高,且不易于分布式 ...

  9. python gui入门的例子_Python GUI编程之Tkinter入门之道

    相信刚学习使用Python进行GUI编程的时候,肯定都会听过Tkinter,毕竟是standard Python interface to the Tk GUI toolkit.用来写一些小程序还是很 ...

最新文章

  1. Effective java 系列之更优雅的关闭资源-try-with-resources
  2. shiro系列一、认识shiro
  3. 2017寒假练习题解 第四周 2.6-2.12
  4. 学习面试题Day08
  5. 梦想中的网络安全和内部协作
  6. C#:invoke 与 BeginInvoke使用区别
  7. 牛客网暑期ACM多校训练营(第一场)
  8. 【LeetCode笔记】20.有效的括号(Java、栈) 21. 合并两个有序链表(Java)
  9. html 字体图标转换工具,字体图标的制作方式
  10. 图像处理总结:Canny边缘检测(二)
  11. SVN移植、合库、分库
  12. win10系统Nessus下载插件错误
  13. ios 保存图片到相册 崩溃_iOS保存图片到相册
  14. 《Python数据分析与挖掘实战》Chapter8中医证型关联规则挖掘笔记
  15. 怎么实现文字转语音朗读?这几个小技巧快来码住
  16. 软件测试的艺术 读书笔记完整版
  17. 关于MIDI键盘的服务对接
  18. transformer中相对位置编码理解
  19. matlab dae,matlab用ode15数值计算微分代数方程(DAE)的问题
  20. linux scsi相关的一些学习笔记

热门文章

  1. vim匹配数字及数量限制
  2. tf.placeholder在测试时带来的坑
  3. mysql主从复制运维_Mysql主从复制配置
  4. c 指定端口连接mysql_c++连接mysql(MYSQL C api使用)
  5. java第七章多线程_第七章 多线程
  6. 退出命令_Vim命令报错问题:无法用:wq命令保存并退出只读文件
  7. Java导出基础 用POI导出Excel
  8. 笔记-项目管理基础知识-项目管理办公室(PMO)
  9. Three.js中自定义控制几何体的点和面的属性
  10. Windows中将文件压缩成linux支持的tar.gz格式的压缩包