HDFS概述(2)————Block块大小设置
参考:
HDFS概述(4)————HDFS权限
HDFS概述(3)————HDFS Federation
HDFS概述(2)————Block块大小设置
HDFS概述(1)————HDFS架构
问题
Q: 一个常被问到的一个问题是: 如果一个HDFS上的文件大小(file size) 小于块大小(block size) ,那么HDFS会实际占用Linux file system的多大空间?
A: 答案是实际的文件大小,而非一个块的大小。
以下内容转自:
http://blog.csdn.net/samhacker/article/details/23089157?utm_source=tuicool&utm_medium=referral
http://snglw.blog.51cto.com/5832405/1643587
实验:
------------------------------------------------------------------------
1. 往hdfs里面添加新文件前,Hadoop在linux上面所占的空间为 464 MB
du -sh /hadoop/hdfs/data/
2. 往hdfs里面添加大小为2673375 byte(大概2.5 MB)的文件
3. 此时,hadoop在linux上面所占的空间为 467 MB——增加了一个实际文件大小(2.5 MB)的空间,而非一个block size(128 MB):
du -sh /hadoop/hdfs/data/
4. 使用hadoop dfs -stat查看文件信息:
这里就很清楚地反映出: 文件的实际大小(file size)是2673375 byte, 但它的block size是128 MB。
5. 通过NameNode的web console来查看文件信息:
结果是一样的: 文件的实际大小(file size)是2673375 byte, 但它的block size是128 MB。
6. 不过使用‘hadoop fsck’查看文件信息,看出了一些不一样的内容—— ‘1(avg.block size 2673375 B)’:
值得注意的是,结果中有一个 ‘1(avg.block size 2673375 B)’的字样。这里的 'block size' 并不是指平常说的文件块大小(Block Size)—— 后者是一个元数据的概念,相反它反映的是文件的实际大小(file size)。
转载于:https://www.cnblogs.com/liango/p/7137443.html
HDFS概述(2)————Block块大小设置相关推荐
- hdfs中一个block块默认多大?
版本不同,默认大小不同.64M.128M都正确. 在Apache Hadoop中默认是64M,Cloudera Hadoop版本中默认是128M.
- linux数据块的大小不一样,HDFS块大小默认为什么是64MB(或者是128MB)
1 HDFS的设计特点? 可以进行超大文件存储 对商用硬件要求不高 式数据访问:适合一次写入,多次读出的场景,适合用来做数据分析,并不适合用来做网盘应用等文件系统. HDFS只支持单个写入者,而且文件 ...
- hdfs的副本数为啥增加了_HDFS详解之块大小和副本数
1.HDFS HDFS : 伪分布式(学习) NN DN SNN sbin/start-dfs.sh(开启hdfs使用的脚本) bin/hdfs dfs -ls (输入命令加前缀bin/hdfs df ...
- Apache Durid 数据存储(Hadoop概述 安装 HDFS概述 数据存储遇到的问题)
Apache Durid 数据存储 Apache Durid 数据存储 1. 分布式技术 1.1 为什么需要分布式 1.1.1 计算问题 1.1.2 存储问题 1.2 分布式系统概述 1.3 分布式实 ...
- HDFS 概念之 block 详解
一般情况下,任何磁盘都有'最小读写单位'的概念,可以理解为该磁盘的'block'.建立在该磁盘之上的文件系统也有'block'的概念,一般为磁盘'block'大小的整数倍.对于用户来说,这些读写限制都 ...
- Hadoop HDFS概述
前言 在现代的企业环境中,单机容量往往无法存储大量数据,需要跨机器存储.统一管理分布在集群上的文件系统称为分布式文件系统. HDFS,是Hadoop Distributed File System的简 ...
- 【HDFS】HDFS文件块大小(重点)
HDFS中的文件在物理上是分块存储(Block),块的大小可以通过配置参数(dfs.blocksize)来规定,默认大小在Hadoop2.x版本中是128M,老版本中是64M. 那么,问题来了,为什么 ...
- HDFS中block的大小
block的大小与修改 Hadoop2.x/3.x版本中Block的默认大小为128M,早前版本中默认为64M,开发人员可以在hdfs-site.xml中添加如下标标签进行修改. <!-- hd ...
- 磁盘的块大小(Block Size)和扇区大小(Sector Size)
来源:http://chenjianjx.iteye.com/blog/1806258 Logical Block Size:A "block", a contiguous num ...
最新文章
- 优化IIS7.5支持10万个同时请求的配置方法
- 数据中心空调故障案例集
- 解决 Flex navigateToURL 中文乱码问题
- java 中覆 写tostring_如何在Java中正确覆盖toString()?
- 2021牛客暑期多校训练营3 I Kuriyama Mirai and Exclusive Or 差分 + 二进制分治
- 2019牛客多校第一场
- php分区表,【MYSQL】分区表
- java声明arraylist,在java构造函数中声明ArrayList
- Bootstrap研究2-布局系统杂记
- 【Flutter】Dart中的类和对象
- ai人工智能操控什么意思_为什么要建立AI分散式自治组织(AI DAO)
- 计算机操作基础知识点总结
- 2022男神/女神完整投票系统Ver5.5.21
- args 打印输出argparse.ArgumentParser()的所有选项和默认值
- 打开showModalDialog模式窗体并提交,且不打开新的IE窗口
- windows server 2008R2安装visual studio2015
- selenium之浏览器弹出新窗口(新页面)
- 计算机更名无法登陆用友u8,用友T6软件修改了计算机名称后,系统管理提示不能连接服务器-用友T6...
- 什么是宏任务、微任务?宏任务、微任务有哪些?又是怎么执行的?
- 相似图片搜索--哈希特征值
热门文章
- 基于计算思维的python程序设计王彬丽期末考试题库_基于计算思维的程序设计类课程教学实践...
- LeetCode算法入门- Longest Common Prefix -day13
- document.createelement如何绑定点击事件_番外篇-EXCEL如何使用宏(VBA)
- c语言 数据结构 list、queue、tree抽象数据类型的定义与实现 详尽代码和注释
- python3的输出函数_教女朋友学Python3(二)简单的输入输出及内置函数查看
原创...
- 基于jsp+Spring boot+mybatis的图书管理系统设计和实现
- 基于javaweb(springboot+mybatis)网上酒类商城项目设计和实现以及文档报告
- 高级语言的编译过程和解释过程_进来了解一下C语言真正的编译过程看你掌握了吗?...
- centos7 修改为任意网卡名_VirtualBox虚拟机双网卡配置实现与本机互通并上网
- 区域显示触发_Nature Communications:地幔数据显示可氧化的火山气体的减少可能触发了大氧化事件...