DataFrame

没有相关API,df可以转为RDD然后再用,另外 也是只有pairRDD才能用

RDD

  def save3(): Unit = {val spark: SparkSession = SparkSession.builder().master("local[1]").appName("test").getOrCreate()//只有pairRDD才能存储为SequenceFile//一般你随便读个json 很多字段是没法保存成SequenceFile的val rdd: RDD[(String, Int)] = spark.sparkContext.parallelize(List(("a", 1), ("b", 2)))rdd.saveAsSequenceFile("data/dir1")}

读取

  def read3(): Unit = {val spark: SparkSession = SparkSession.builder().master("local[1]").appName("test").getOrCreate()//读取时必须指定SequenceFile kv的泛型,不然会报错的val rdd: RDD[(String, Int)] = spark.sparkContext.sequenceFile[String, Int]("data/dir1")println(rdd.collect().mkString(","))//(a,1),(b,2)}

总结

  • SequenceFile只能用于pairRDD,局限性很大

参考

How to save Spark Data Frames to Sequence File - Big Data / Apache Spark - itversity

spark 读写SequenceFile相关推荐

  1. spark写入oracle 优化,spark读写数据库大表分区性能优化

    spark读写数据库大表分区性能优化:经常会遇到spark读写数据库再做分析,像mysql或oracle. 在数据量很大的情况下,如果只有一个worker一个excutor一个task,那你excut ...

  2. Spark读写HBase(主要讲解SHC的使用)

    前言 Spark读写HBase本身来说是没啥可以讲的,最早之前都是基于RDD的,网上的资料就太多了,可以参考: 参考链接1 参考链接2 其实都一样,后来有了Hortonworks公司的研发人员研发了一 ...

  3. Zeppelin上通过Spark读写mysql数据库

    Zeppelin上通过Spark读写mysql数据库 一.从mysql数据库获取数据 二.把处理后的数据再插入到mysql数据库 一.从mysql数据库获取数据 %spark val df = spa ...

  4. 【大数据开发】SparkSQL——RDD、DataFrame、DataSet相互转换、DSL常用方法、SQL风格语法、Spark读写操作、获取Column对象的方式

    take,takeAsList是Action操作 limit⽅法获取指定DataFrame的前n⾏记录,得到⼀个新的DataFrame对象.和take与head不同的是,limit⽅法不是Action ...

  5. spark读写Doris实现及Doris文档更新

    因为公司要处理流量数据,其中设计到了会话id的处理,从而需要用spark来实现这一功能. 而公司的数仓是基于Doris搭建的,这就涉及到了spark读写Doris,简单来说一下spark读写Doris ...

  6. Spark读写Hbase的二种方式对比

    作者:Syn良子 出处:http://www.cnblogs.com/cssdongl 转载请注明出处 一.传统方式 这种方式就是常用的TableInputFormat和TableOutputForm ...

  7. Spark读写XML文件及注意事项

    最近有粉丝问浪尖spark 如何读写xml格式的文件,尤其是嵌套型的,spark本身是不支持xml格式文件读取的,但是databricks开源了一个jar,支持xml文件的读写,浪尖这里给大家介绍一下 ...

  8. spark2读取oracle工具类,spark读写Oracle、hive的艰辛之路(一)

    前两天工作需求,要通过给的几个Oracle的视图把数据入到hive库中,很遗憾,使用的华为云平台的集区环境中并没有sqoop1,当然也并没有sqoop2,所以,想到的解决方案是使用spark读取Ora ...

  9. pyspark读写SequenceFile

    完整代码如下: # -*- coding: utf-8 -*- import sys reload(sys) sys.setdefaultencoding('utf-8') # @Author: ap ...

最新文章

  1. SAP EWM中仓库任务WT创建的函数
  2. 20165330 结对编程项目-四则运算 第一周
  3. OPENCV-6 学习笔记
  4. 最大乘积(记忆化搜索)
  5. 在Xcode以及Interface Builder下简单使用Cocoa
  6. 一个教务系统多少钱_ERP系统多少钱
  7. spring源码解析(一)---占位符解析替换
  8. C#的Bitmap.LockBits 使用说明
  9. html登录界面QQ微信图标,discuz修改QQ登录图标和微信登录图标的方法
  10. php引用字体,php – 使用imagettftext()时,如何处理字体文件不支持的字符?
  11. 搜索引擎算法大全(吐血整理)
  12. “本人成分” 如何填写
  13. java计算机毕业设计火炬中学校刊在线投稿审稿系统源码+数据库+系统+lw文档+mybatis+运行部署
  14. Spring Boot 定制横幅banner与关闭banner
  15. 安卓 post请求与回调(绑接口)
  16. Java基础(二)集合
  17. java 写 xml 文件 工具类_XML读写工具类
  18. 荣耀50和荣耀50se参数对比 哪个更值得入手
  19. Redis数据结构 GeoHash
  20. Java精品项目源码第53期流浪动物管理系统

热门文章

  1. 代码上传到github上
  2. easyui crud java_轻松学习jQuery插件EasyUI EasyUI创建CRUD应用
  3. 现在维吾尔语在计算机中发展,维吾尔语手写体在线计算机识别技术研究.doc
  4. PyCharm社区版支持深度学习_在Windows的Ubuntu子系统运行支持CUDA的深度学习代码
  5. Win10安装Ubuntu18.04双系统,图文详解,全网最详细教程
  6. oracle extract类型,Oracle中extract()函数
  7. python正则表达式 多个条件的匹配
  8. cesium +vue项目怎么运行
  9. mysql 配置root密码_Mysql安装与配置调优及修改root密码的方法
  10. 自动生成html_python自动化测试中pytest的使用