参考:

HDFS概述(4)————HDFS权限

HDFS概述(3)————HDFS Federation

HDFS概述(2)————Block块大小设置

HDFS概述(1)————HDFS架构

问题

Q: 一个常被问到的一个问题是: 如果一个HDFS上的文件大小(file size) 小于块大小(block size) ,那么HDFS会实际占用Linux file system的多大空间?

A: 答案是实际的文件大小,而非一个块的大小。

以下内容转自:

http://blog.csdn.net/samhacker/article/details/23089157?utm_source=tuicool&utm_medium=referral

http://snglw.blog.51cto.com/5832405/1643587

实验:

------------------------------------------------------------------------

1. 往hdfs里面添加新文件前,Hadoop在linux上面所占的空间为 464 MB

du -sh /hadoop/hdfs/data/

2. 往hdfs里面添加大小为2673375 byte(大概2.5 MB)的文件

3. 此时,hadoop在linux上面所占的空间为 467 MB——增加了一个实际文件大小(2.5 MB)的空间,而非一个block size(128 MB)

du -sh /hadoop/hdfs/data/

4. 使用hadoop dfs -stat查看文件信息:

这里就很清楚地反映出: 文件的实际大小(file size)是2673375 byte, 但它的block size是128 MB。

5. 通过NameNode的web console来查看文件信息:

结果是一样的: 文件的实际大小(file size)是2673375 byte, 但它的block size是128 MB。

6. 不过使用‘hadoop fsck’查看文件信息,看出了一些不一样的内容——  ‘1(avg.block size 2673375 B)’:

值得注意的是,结果中有一个 ‘1(avg.block size 2673375 B)’的字样。这里的 'block size' 并不是指平常说的文件块大小(Block Size)—— 后者是一个元数据的概念,相反它反映的是文件的实际大小(file size)。

转载于:https://www.cnblogs.com/liango/p/7137443.html

HDFS概述(2)————Block块大小设置相关推荐

  1. hdfs中一个block块默认多大?

    版本不同,默认大小不同.64M.128M都正确. 在Apache Hadoop中默认是64M,Cloudera Hadoop版本中默认是128M.

  2. linux数据块的大小不一样,HDFS块大小默认为什么是64MB(或者是128MB)

    1 HDFS的设计特点? 可以进行超大文件存储 对商用硬件要求不高 式数据访问:适合一次写入,多次读出的场景,适合用来做数据分析,并不适合用来做网盘应用等文件系统. HDFS只支持单个写入者,而且文件 ...

  3. hdfs的副本数为啥增加了_HDFS详解之块大小和副本数

    1.HDFS HDFS : 伪分布式(学习) NN DN SNN sbin/start-dfs.sh(开启hdfs使用的脚本) bin/hdfs dfs -ls (输入命令加前缀bin/hdfs df ...

  4. Apache Durid 数据存储(Hadoop概述 安装 HDFS概述 数据存储遇到的问题)

    Apache Durid 数据存储 Apache Durid 数据存储 1. 分布式技术 1.1 为什么需要分布式 1.1.1 计算问题 1.1.2 存储问题 1.2 分布式系统概述 1.3 分布式实 ...

  5. HDFS 概念之 block 详解

    一般情况下,任何磁盘都有'最小读写单位'的概念,可以理解为该磁盘的'block'.建立在该磁盘之上的文件系统也有'block'的概念,一般为磁盘'block'大小的整数倍.对于用户来说,这些读写限制都 ...

  6. Hadoop HDFS概述

    前言 在现代的企业环境中,单机容量往往无法存储大量数据,需要跨机器存储.统一管理分布在集群上的文件系统称为分布式文件系统. HDFS,是Hadoop Distributed File System的简 ...

  7. 【HDFS】HDFS文件块大小(重点)

    HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs.blocksize)来规定,默认大小在Hadoop2.x版本中是128M,老版本中是64M. 那么,问题来了,为什么 ...

  8. HDFS中block的大小

    block的大小与修改 Hadoop2.x/3.x版本中Block的默认大小为128M,早前版本中默认为64M,开发人员可以在hdfs-site.xml中添加如下标标签进行修改. <!-- hd ...

  9. 磁盘的块大小(Block Size)和扇区大小(Sector Size)

    来源:http://chenjianjx.iteye.com/blog/1806258 Logical Block Size:A "block", a contiguous num ...

最新文章

  1. 优化IIS7.5支持10万个同时请求的配置方法
  2. 数据中心空调故障案例集
  3. 解决 Flex navigateToURL 中文乱码问题
  4. java 中覆 写tostring_如何在Java中正确覆盖toString()?
  5. 2021牛客暑期多校训练营3 I Kuriyama Mirai and Exclusive Or 差分 + 二进制分治
  6. 2019牛客多校第一场
  7. php分区表,【MYSQL】分区表
  8. java声明arraylist,在java构造函数中声明ArrayList
  9. Bootstrap研究2-布局系统杂记
  10. 【Flutter】Dart中的类和对象
  11. ai人工智能操控什么意思_为什么要建立AI分散式自治组织(AI DAO)
  12. 计算机操作基础知识点总结
  13. 2022男神/女神完整投票系统Ver5.5.21
  14. args 打印输出argparse.ArgumentParser()的所有选项和默认值
  15. 打开showModalDialog模式窗体并提交,且不打开新的IE窗口
  16. windows server 2008R2安装visual studio2015
  17. selenium之浏览器弹出新窗口(新页面)
  18. 计算机更名无法登陆用友u8,用友T6软件修改了计算机名称后,系统管理提示不能连接服务器-用友T6...
  19. 什么是宏任务、微任务?宏任务、微任务有哪些?又是怎么执行的?
  20. 相似图片搜索--哈希特征值

热门文章

  1. 基于计算思维的python程序设计王彬丽期末考试题库_基于计算思维的程序设计类课程教学实践...
  2. LeetCode算法入门- Longest Common Prefix -day13
  3. document.createelement如何绑定点击事件_番外篇-EXCEL如何使用宏(VBA)
  4. c语言 数据结构 list、queue、tree抽象数据类型的定义与实现 详尽代码和注释
  5. python3的输出函数_教女朋友学Python3(二)简单的输入输出及内置函数查看 原创...
  6. 基于jsp+Spring boot+mybatis的图书管理系统设计和实现
  7. 基于javaweb(springboot+mybatis)网上酒类商城项目设计和实现以及文档报告
  8. 高级语言的编译过程和解释过程_进来了解一下C语言真正的编译过程看你掌握了吗?...
  9. centos7 修改为任意网卡名_VirtualBox虚拟机双网卡配置实现与本机互通并上网
  10. 区域显示触发_Nature Communications:地幔数据显示可氧化的火山气体的减少可能触发了大氧化事件...