​ Spark的数据读取以及数据保存可以从两个维度来作区分:文件格式以及文件系统。

文件格式为:text文件、csv文件、sequence文件以及Object文件;

文件系统为:本地文件系统、HDFS、HBASE以及数据库

text文件

读文件:textFile

存文件:saveAsTextFile

sequence文件

SequenceFile文件是Hadoop用来存储二进制形式的key-value对而设计的一种平面文件(Flat File)

存文件:saveAsSequenceFile(“output”)

读文件:sequenceFileInt,Int.collect().foreach(println)

object对象文件

对象文件是将对象序列化后保存的文件,采用Java的序列化机制。可以通过objectFile[T:ClassTag] (path)函数接收一个路径,读取对象文件,返回对应的RDD,也可以通过调用savaAsObjectFile()实现对对象文件的输出、因为是序列化所以指定类型

存文件:saveAsObjectFile(“output”)

读文件:objectFileInt.collect().foreach(println)

RDD文件读取与保存相关推荐

  1. Spark的RDD 文件读取与保存

    RDD 文件读取与保存 Spark 的数据读取及数据保存可以从两个维度来作区分:文件格式以及文件系统.其中: (1)文件格式分为:text 文件.csv 文件.sequence 文件以及Object ...

  2. 2.Open3D教程——文件读取和保存

    文件读取和保存 本教程演示了Open3D如何读写基本数据结构. 1. 点云 下面的代码读取和写入点云. print("Testing IO for point cloud ..." ...

  3. python 常用文件读取和保存方式汇总

    python 常用文件读取和保存方式汇总 txt文件 open和close函数 文件对象的方法 读写示例理解rwa中的指针 w a r txt文件 open和close函数 fileObject = ...

  4. java文件读取与保存

    文件读取与保存 Long startTime=System.currentTimeMillis();String jsonStr = "";try {File jsonFile = ...

  5. Bitmap位图文件读取、保存、屏幕截图

    虽然现在网上已经有很多位图读取.保存的文章,很多写的都很详细,提供的源代码功能也很强大,但是我仍然要自己重写一个位图加载程序.主要是因为这些大牛们的文章写的太深奥了,代码功能太强大了,以至于像我这样的 ...

  6. PDS4格式文件读取与保存

    文章目录 前言 一.获取PDS4数据 二.PDS4格式图像读取 1.下载pds4-tools库 2.读入数据 三.保存PDS4格式数据 1.下载osgeo库 2.保存PDS4 参考文章 前言 在航天领 ...

  7. python使用opencv保存视频_Pythone OpenCV学习笔记之:视频文件读取与保存

    # -*- coding: utf-8 -*- # 读取和保存视频 import cv2 as cv import numpy as np def decode_fourcc(v): v = int( ...

  8. TensorFlow学习笔记02:使用tf.data读取和保存数据文件

    TensorFlow学习笔记02:使用tf.data读取和保存数据文件 使用`tf.data`读取和写入数据文件 读取和写入csv文件 写入csv文件 读取csv文件 读取和保存TFRecord文件 ...

  9. python对修改图片尺寸后的labelimg2/rolabelimg生成的XML文件进行多级节点的读取/修改/保存

    已经做了四张图片的标注,很复杂,但遇到两个问题: labelimg2无法对边界处的目标进行标注,导致标注不完全: 后续的算法是基于正方形的图片进行训练的,虽然可以训练矩形,但要多一步,不如在标注前就处 ...

最新文章

  1. java md5算法,JAVA实现MD5算法
  2. 【面试招聘】有哪些好的秋招经验分享?数据、算法岗的几点经验分享
  3. android java 打开snd,使用SndPlaySound从内存中播放WAV
  4. 《对Java的分析总结》-Java中的垃圾回收机制中的标记-清除算法 (五)
  5. Visual C++ 2008入门经典 第二十一章更新数据源
  6. 蓝桥杯 ALGO-22算法训练 数的划分
  7. 使用JUnit-4.11报java.lang.NoClassDefFoundError:
  8. 一项千年太空任务即将拯救人类——科学家们正在密谋中
  9. html 获取浏览器宽高,js获取浏览器高度与宽度的方法
  10. APP部分漏洞及解决方法
  11. 独立开发一款简单的安卓app
  12. Android加密文件系统
  13. Zookeeper之Curator分布式锁简单模拟12306抢票
  14. XM外汇官网 xm-cnfx.com 外汇新手交易者必备!选择交易商一定要看的7个方面
  15. Word页眉设置不同的文字,但是页码按照顺序不变
  16. C# chart控件中游标随着鼠标移动
  17. QEMU(3) 参数解析
  18. 爬虫 【第一章】爬虫基本原理
  19. 百度打不开,其它网站正常
  20. IDEA 搭建黑马品优购商城

热门文章

  1. 2016.01.10 论文扩充、精修、查重
  2. UISegmentedControl判断点击第几项
  3. ubuntu16.04装机7: 挂载机械硬盘
  4. 调试错误:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte
  5. tf.GraphKeys,tf.add_to_collection() 与 tf.get_collection()
  6. 机器学习回顾篇(2):最小二乘法
  7. 白话之jsonp跨域原理分析
  8. Java的clone方法
  9. git 如何关联多个库
  10. 从0开始搭建SQL Server AlwaysOn 第一篇(配置域控)