3.5  Java接口

在本小节,我们要深入探索Hadoop的Filesystem类:与Hadoop的文件系统交互的API。 虽然我们主要关注的是HDFS的实现DistributedFileSystem,但总体来说,还是应该努力编写不同于FileSsytem抽象类的代 码,以保持其在不同文件系统中的可移植性。这是考验编程能力的最佳手段,因为我们很快就可以使用存储在本地文件系统中的数据来运行测试了。

3.5.1  从Hadoop URL中读取数据

要从Hadoop文件系统中读取文件,一个最简单的方法是使用java.net.URL对象来打开一个数据流,从而从中读取数据。一般的格式如下:

InputStream in = null;

try {

in = new URL(“hdfs://host/path”).openStream();

// process in

} finally {

IOUtils.closeStream(in);

}

这里还需要一点工作来让Java识别Hadoop文件系统的URL 方案,就是通过一个FsUrlStreamHandlerFactory实例来调用在URL中的setURLStreamHandler-Factory 方法。这种方法在一个Java虚拟机中只能被调用一次,因此一般都在一个静态块中执行。这个限制意味着如果程序的其他部件(可能是不在你控制中的第三方部 件)设置一个URLStreamHandlerFactory,我们便无法再从Hadoop中读取数据。下一节将讨论另一种方法。

例3-1展示了以标准输出显示Hadoop文件系统的文件的程序,它类似于Unix的cat命令。

例3-1:用URLStream

java读取hadoop数据_从Hadoop URL中读取数据_hadoop 数据读取_hadoop读取文件相关推荐

  1. boot spring 接口接收数据_在 Spring Boot 中使用 Dataway 配置数据查询接口

    Dataway介绍 Dataway 是基于 DataQL 服务聚合能力,为应用提供的一个接口配置工具.使得使用者无需开发任何代码就配置一个满足需求的接口. 整个接口配置.测试.冒烟.发布.一站式都通过 ...

  2. xlsx表格怎么筛选重复数据_怎样在excel2010中筛选出重复数据呢?

    数据是信息的表现形式和载体,可以是符号.文字.数字.语音.图像.视频等.数据和信息是不可分离的,数据是信息的表达,信息是数据的内涵.在这一篇教程里面,小编主要和大家简单的介绍一下:怎样在Excel20 ...

  3. ppt扇形图怎么显示数据_如何给PPT中自带的数据图表(柱形图,饼图,条形图,折线图等)添加合适、简约的动画...

    首先我们从柱形图开始,最终我们希望做出下面的几种效果, 1.插入柱形图. 依次点击"插入"--"图表"--"柱形图", 这里选择第一个(簇状 ...

  4. data类型的Url格式及Base64编码:把小数据直接嵌入到Url中

    所谓"data"类型的Url格式,是在RFC2397中 提出的,目的对于一些"小"的数据,可以在网页中直接嵌入,而不是从外部文件载入.例如对于img这个Tag, ...

  5. Bootstrap data类型的Url格式--url(data:image/gif;base64,AAAA):把小数据直接嵌入到Url中

    原文链接http://shiyun1013.blog.163.com/blog/static/1077403620111113234714/ 所谓"data"类型的Url格式,是在 ...

  6. data类型的Url格式--url(data:image/gif;base64,AAAA):把小数据直接嵌入到Url中

    所谓"data"类型的Url格式,是在RFC2397中提出的,目的对于一些"小"的数据,可以在网页中直接嵌入,而不是从外部文件载入.例如对于img这个Tag,哪 ...

  7. data类型的Url格式:把小数据直接嵌入到Url中

    原文地址: data类型的Url格式:把小数据直接嵌入到Url中 所谓"data"类型的Url格式,是在RFC2397中提出的,目的对于一些"小"的数据,可以在 ...

  8. Background中data类型的Url格式url(data:image/gif;base64,AAAA)把小数据直接嵌入到Url中

    原文地址:http://blog.csdn.net/zuo_hy/article/details/38866935 所谓"data"类型的Url格式,是在RFC2397中提出的,目 ...

  9. 数组x中数据复制到数组y中,重复的数据只存储一次,最后输出y;计算x中数据的平均值ave及大于平均值的元素个数n。c++实现

    题目描述 编程序,实现如下功能: (1)定义两个一维数组x,y,不超过50个元素. (2)从键盘输入k个整数到数组x中. (3)计算x中数据的平均值ave及大于平均值的元素个数n并输出. (4)将数组 ...

  10. 数据逻辑结构在计算机存储器中的表示称为数据的存储结构

    数据逻辑结构在计算机存储器中的表示称为数据的存储结构(或存储表示),也称为物理结构.通常情况下,同一种逻辑结构可以设计多种存储结构,在不同的存储结构中,实现同一种运算的算法可能不同. 逻辑结构.存储结 ...

最新文章

  1. 机器学习-分类之AdaBoost原理及实战
  2. 领导给了一堆无序杂乱的数据,我写了个Python自动化脚本
  3. java发送带附件的邮件_Java发送邮件(带附件)
  4. CocoaPods之Podfile\Podfile.lock
  5. u深度重装系统详细教程_u深度一键还原精灵电脑重装系统使用教程
  6. amazon linux ami root 密码,Amazon Linux AMI 2015.09 (HVM)平台搭建lamp
  7. Elasticsearch常用搜索和分词器
  8. 用户DSN、系统DSN、文件DSN的区别
  9. 2015年换工作感想
  10. android中关于keytool 错误:java.lang.Exception:密钥库文件不存在: 解决步骤
  11. 计算机频道地读写硬盘是因为,怎样读取硬盘数据
  12. 计算机 文笔不好的论文,文笔差怎么写出好文章
  13. 微信网页授权登录的方法
  14. amp; AMP; 会显示位 | Amp;aMp;amP;会原样显示
  15. 2015-4-20分享的pdf
  16. Spring Cloud 统一配置
  17. 基于javaweb的酒店客房管理系统(java+jsp+html+bootstrap+jquery+servlet+mysql)
  18. 信息安全工程师-选择题(一)
  19. 这个技术发展到现在就为了让你能愉快地多打几局游戏
  20. 1597 - 买文具

热门文章

  1. 【C++】算法集锦(12):高楼扔鸡蛋
  2. Kubernetes 集群和应用监控方案的设计与实践
  3. 如何用androidstudio自带监控内存工具监控内存
  4. PTA 兔子繁衍问题
  5. LUNA 黑天鹅事件:Terra CEO关于项目应急方案的社区AMA
  6. Fanvas将旧网站的swf动画转为canvas,以解决移动端swf动画无法显示问题
  7. 三国演义告诉你的60条真理
  8. 红帽linux编程结束编辑,红帽文件相关操作
  9. 怎么把APP上传到各大安卓应用商店
  10. win10家庭中文正式版输入法切换快捷键设置为Ctrl+Shift