然后我们再来看看,如果我们的文件比较大,比如一个文件有10g,这个如果是个日志文件的话,

我们只读取最新的128M可以嘛?

因为我们只关心最新的日志对吧.

是可以的.

首先我们上传一个大点的文件,去hdfs中去,比如这个

hadoop fs -put /opt/software/hadoop-2.7.2.tar.gz / 上传到根目录

然后我们去看看,可以看到

有个block0

size是1

大数据之-Hadoop之HDFS的API操作_定位读取文件_只读取某个block的内容_案例---大数据之hadoop工作笔记0065相关推荐

  1. 大数据之-Hadoop之HDFS的API操作_判断是文件还是文件夹---大数据之hadoop工作笔记0062

    然后我们再来看看,利用hadoop的hdfs的java的api来判断,当前的给出的路径是个 文件夹还是个文件. 我们写一下代码,我们判断根目录下的所有文件,循环判断是文件还是文件并打印 可以看到我们执 ...

  2. 大数据之-Hadoop之HDFS的API操作_修改文件的名称---大数据之hadoop工作笔记0060

    然后我们再去看看文件的名称的修改. 可以看到用的rename的hadoop的hdfs的java的api 执行前可以看到这个文件名称是banzhagn.txt 执行以后可以看到就修改成了yanjing. ...

  3. 大数据之-Hadoop之HDFS的API操作_文件上传---大数据之hadoop工作笔记0056

    然后我们HDFS的java的api操作. 比如我们有个需求从mysql中把数据上传到完全分布式的集群中的,hdfs中 比如这里首先我们演示,把e盘下的banzhang.txt文件上传到完全分布式集群h ...

  4. 大数据之-Hadoop之HDFS的API操作_机架感知_副本存储的节点的选择---大数据之hadoop工作笔记0068

    然后我们再来看一下,这个,hadoop的hdfs的机架感知,如何为某个上传的文件,这里如果是默认是,3个副本的话, 比如有1000台datanode,那么hadoop如何为这个3个副本选择合适的节点, ...

  5. 大数据之-Hadoop之HDFS的API操作_文件IO流_上传_案例---大数据之hadoop工作笔记0063

    然后我们来看一下HDFS的I/O流操作,这里我们实现文件上传. 这个是文档代码 我们自己写一写,分5步

  6. 大数据之-Hadoop之HDFS的API操作_写数据流程_上传数据原理剖析_案例---大数据之hadoop工作笔记0066

    hdfs的数据流,的写入过程,也就是,文件从本地上传到hdfs的过程,我们来看原理. 1.首先第一步我们的客户端去向,我们的完全分布式集群,像namenode节点,发起一个文件上传请求,并且把要上传的 ...

  7. 大数据之-Hadoop之HDFS的API操作_网络拓扑_节点离客户端的距离计算---大数据之hadoop工作笔记0067

    然后我们再来看一下,我们说,namenode,在响应客户端发来的,文件上传的请求以后,会响应给客户端 告诉客户端,应该把数据,存到哪几个节点上去.比如这里返回给了客户端datanode1,datano ...

  8. 大数据之-Hadoop之HDFS的API操作_文件IO流_下载_案例---大数据之hadoop工作笔记0064

    我们再去实现,文件的下载,下载其实就是,文件输入流,是hdfs上面的文件,输出流是本地的文件,跟上传很像. 写完以后我们执行 先看看,本地没有banhua.txt对吧

  9. 大数据之-Hadoop之HDFS的API操作_文件夹_以及文件删除案例---大数据之hadoop工作笔记0059

    然后我们再来看hdfs操作,删除文件夹 就上面这样写就可以了,但是可以看到有第二个参数 上面也有介绍了,源码中写, 如果这个参数设置为true的话,并且要删除的是个文件夹的话,那么 这个时候就不会抛出 ...

最新文章

  1. 允许用户在web Interface上修改密码
  2. android 周报,MAndroid 周报第八期
  3. Tungsten Fabric SDN — Service Chain — Basic Service Chain and Policy-Based Steering
  4. Nginx-02:Nginx基本概念
  5. 最大子序列求和_最大子序列和问题
  6. seL4 microkernel学习资料
  7. Mysqlbackup 8全备增量备份还原案例
  8. 【渝粤题库】国家开放大学2021春1018国际公法题目
  9. Python程序员的圣经——《Python编程快速上手:让繁琐工作自动化》尾末附下载地址
  10. 推荐几个Vue开发必备插件,要收藏
  11. 校招刷题---java选择题笔记02
  12. 系泊系统 matlab 代码,系泊系统的设计
  13. 解决extremeComponents中文按拼音排序问题
  14. Web测试常用测试点
  15. 如何撰写总体设计与详细设计文档
  16. 差异表达基因变化倍数_重磅推出!欧易关键基因筛选报告
  17. mysql连接泄露 定位_数据库连接泄漏
  18. 爱江山更爱美人服务器维修,微信爱江山更爱美人修改版-微信爱江山更爱美人VIP满级修改版预约 v1.0.0-友情手机站...
  19. Maven打包依赖将依赖的Jar包也打进去
  20. html旅游门票源代码,票务网站整套静态模板 HTML模板

热门文章

  1. sqlserver 参数化查询 允许为null_关于SQL Server的insert执行的秘密(上)一个最简单的insert分析...
  2. python人工智能方向怎么学_人工智能方向需要学习python或是深度学习呢?
  3. 关于肺结节检测相关的FROC曲线和目标检测中Precision-Recall曲线,ROC曲线,mAP,AP,APs,APm,APl,AP0.5等的理解。
  4. pytorch中unsqueeze()和squeeze()函数
  5. 更新QTableView中的进度条状态
  6. HOG特征提取算法的过程
  7. O036、Snapshot Instance 操作详解
  8. Codeforces 861 A k-rounding 数论
  9. JAVA基础自学笔记整理(一)某些数据类型的姿势
  10. MATLAB实现PCA(主成分分析)