1 背景

基于spark 开发程序

数据放在本地文件中,为text格式

本文语言案例为java

2   步骤

2.1 搭建工程

​​​​​​​ 基于maven搭建spark工程_this is a book的博客-CSDN博客

2.2 代码示例

 SparkConf conf = new SparkConf().setAppName("demo").setMaster("local[*]");SparkSession sparkSession = SparkSession.builder().config(conf).getOrCreate();JavaSparkContext javaSparkContext = new JavaSparkContext(sparkSession.sparkContext());JavaRDD<String> rdd = javaSparkContext.textFile(INPUT_PATH); rdd.foreach(new VoidFunction<String>() {@Overridepublic void call(String s) throws Exception {System.out.println(s);}}); 

3   注意事项

如果是放在linux 服务器上,并且跑在spark 上,文件路径需要加这个前缀

file:///data/demo.text

原因是spark一般和hdms组合使用,读取本地文件需要加前缀表明读取的是本地文件

spark 读取本地文件相关推荐

  1. Spark读取本地文件和HDFS文件

    前言 旁边的实习生又一脸懵逼了:Spark有bug,明明我本地/data目录下有test.txt文件,但运行就报错: Caused by: java.io.FileNotFoundException: ...

  2. 关于在Spark集群中读取本地文件抛出找不到文件异常的问题

    关于在Spark集群中读取本地文件抛出找不到文件异常的问题 一般情况下,我们在本地ide里写好程序,打成jar包上传到集群取运行,有时候需要读取数据文件,这个时候需要注意,如果程序中读取的是本地文件, ...

  3. java读取本地文件_java 读取本地文件实例详解

    java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...

  4. python读取本地文件-python解析本地HTML文件

    Python使用爬虫技术时,每运行一次,本地都会访问一次主机.为避免完成程序前调试时多次访问主机增加主机负荷,我们可以在编写程序前将网页源代码存在本地,调试时访问本地文件即可.现在我来分享一下爬取资料 ...

  5. QListWidget读取本地文件夹中文件并显示名字,双击读取xml数据

    文章目录 前言 一.读取本地文件并显示 二.双击读取数据 前言 本文主要是为了解决QListWidget读取本地文件夹中文件,并且显示的问题.然后双击读取其中xml数据 一.读取本地文件并显示 如下的 ...

  6. 用Groovy读取本地文件的代码

    下面这些包默认已经被导入了,不需要使用import再次显式导入: java.io.* java.lang.* java.math.BigDecimal java.math.BigInteger jav ...

  7. js读写php文件,在js中如何读取本地文件

    下面我就为大家分享一篇js读取本地文件的实例,具有很好的参考价值,希望对大家有所帮助. 如何用在浏览器端预览本地文件? 今天的主题是使用浏览器预览本地文件. 由于浏览器安全策略的限制,javascri ...

  8. java接收并存储文件_客户端读取本地文件的数据,发送到服务器,服务器接收并存储到文件中...

    只实现了传送文件的功能. 编写Socket客户端和服务器程序,客户端读取本地文件的数据,发送到服务器,服务器接收并存储到文件中. 消息格式: 字段 长度(单位字节) 内容 -------------- ...

  9. java 读取本地文件_java 读取本地文件实例详解

    java 读取本地文件实例详解 用javax.xml.w3c解析 实例代码: package cn.com.xinli.monitor.utils; import org.w3c.dom.Docume ...

最新文章

  1. python 在字典插入值和修改字典value值的方法
  2. Jquery的.post说解(一)
  3. 深圳Uber优步司机奖励政策(12月28日到1月3日)
  4. python3精要(28)-filter
  5. linux指令快速复制粘贴[龟速更新中]
  6. 单点登录Redis存储Session及Cookie场景介绍
  7. 物联网将如何改善社会运行效率?
  8. 英寸和厘米的交互python_Python / PyQt4:如何找到显示器的尺寸(以英寸为单位)?...
  9. java接口自动化测试
  10. sklearn机器学习之分类预测算法应用
  11. 企业如何应用ERP?企业应用ERP流程详解。
  12. 软件测试报告模板怎么写,这篇文章告诉你
  13. 路由协议-ospf配置
  14. 简单几步开启Mac访问NTFS格式读写
  15. im即时通讯开发:浅析MQTT通信协议
  16. jsoup爬取网站信息之《冰与火之歌》
  17. 【计算机网络】计算机网络常用网络命令
  18. 计算机毕业设计springboot通用项目的项目管理系统
  19. 服务器运行时间设置,时间服务器设置
  20. 液相色谱仪计算机化用户需求,液相色谱仪满足用户的技术要求

热门文章

  1. 【UML】软件设计说明书 (完结)
  2. 电脑快捷键快速关机方法,电脑如何快速关机
  3. 小而美的ToDo 待办事项便签工具,高效管理工作生活一切琐事
  4. torch.mul、matmul、mm、bmm的区别
  5. 符合python语言变量命名规则_符的解释|符的意思|汉典“符”字的基本解释
  6. epub 格式转换成 mobi
  7. 开源项目 - 收藏集 - 掘金
  8. L版本修改默认静态壁纸wallpaper
  9. 51单片机教程:51单片机驱动四个8*8点阵,拼凑16*16点阵显示标准汉字。
  10. 思维导图学习法 手把手教你思维导图怎么画