Hadoop不足:

1.不适合低延迟数据访问

HDFS面向大规模数据批处理设计,采用流式数据处理,具有很高的数据吞吐率,但这也意味着有较高的延时。

2.不能够高效的存储小文件数据

Hadoop是基于HDFS文件存储系统,HDFS是采用块为基本单位存储数据,每个块大小为64KB(不确定现在多少),如果一个文件达不到64KB,也会存成一个独立的块。如果存在大量的小文件(假设都小于64KB)那么会造成每个块都无法存储满,造成大量的空间浪费。

HDFS是采用主从节点架构。集群中只设置一个主节点(可能有备份主节点),可由很多个从节点。主节点负责集群管理,资源配置,作业调度等。从节点负责数据的存储与读取。HDFS采用主节点管理元数据,元数据被保存在内存中,从而使得客户端可以快速查询到数据块位置,数据块号。然后再在从节点读写数据。如果存在大量小文件,则会使得在主节点查询效率降低。导致主节点效率下降。

3.不支持用户写入并修改文件

Hadoop现在还不支持多人写入,任意修改的功能。只允许一个文件有一个写入者,不允许多个用户堆同一文件执行写操作,而且只允许对文件进行追加,也就是说每次写入都会添加在文件末尾(区分关系型数据库的特点)。

hadoop的限制/不足相关推荐

  1. hadoop 添加删除机器以及设置免密登录

    添加hadoop机器 先在slaves中添加机器 然后启动datanode $: ./usr/hadoop-0.20.2-cdh3u4/bin/hadoop-daemon.sh start datan ...

  2. linux环境下快速配置hadoop集群免密登录

    背景 在hadoop的日常使用过程中经常需要登录某些机器,如何更好的免密登录呢?这将为我们节省大量的时间 操作 假设你需要在A机器上免密登录B机器,那么你首先要确定B机器下是有秘钥文件的.如何确定是否 ...

  3. hadoop问题小结

    20220322 https://blog.csdn.net/lt5227/article/details/119459827 hadoop控制台设置密码 访问验证 20220314 进入hive 高 ...

  4. hadoop,spark,scala,flink 大数据分布式系统汇总

    20220314 https://shimo.im/docs/YcPW8YY3T6dT86dV/read 尚硅谷大数据文档资料 iceberg相当于对hive的读写,starrocks相当于对mysq ...

  5. spark,hadoop区别

    https://zhuanlan.zhihu.com/p/95016937 Spark和Hadoop的区别和比较: 1.原理比较: Hadoop和Spark都是并行计算,两者都是用MR模型进行计算 H ...

  6. 2021年大数据Hadoop(三十):Hadoop3.x的介绍

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 Hadoop3.x的介绍 介绍 Hadoop 3.0新特性 ...

  7. 2021年大数据Hadoop(二十九):​​​​​​​关于YARN常用参数设置

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 关于yarn常用参数设置 设置container分配最小内 ...

  8. 2021年大数据Hadoop(二十七):YARN运行流程

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 Yarn运行流程 本系列历史文章 2021年大数据Hado ...

  9. 2021年大数据Hadoop(二十六):YARN三大组件介绍

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 Yarn三大组件介绍 ResourceManager No ...

  10. 2021年大数据Hadoop(二十五):YARN通俗介绍和基本架构

    全网最详细的Hadoop文章系列,强烈建议收藏加关注! 后面更新文章都会列出历史文章目录,帮助大家回顾知识重点. 目录 本系列历史文章 前言 YARN通俗介绍和基本架构 Yarn通俗介绍 Yarn基本 ...

最新文章

  1. Vue开发使用Axios遇到了大坑!
  2. Web网站搭建从零到一
  3. Jmeter --- 分布式测试
  4. ubuntu 安装eclipse neon版本
  5. 国外优秀技术站点推荐
  6. C++ 类对象和 指针的区别
  7. 20150401--Dede+搜索页面,评论
  8. codeforces:ProblemMset
  9. css贝塞尔曲线 多个点_了解贝塞尔曲线的数学和Python实现示例
  10. 在mac上制作PDF的基础教程
  11. mtkwin10驱动_Windows系统MTK手动安装驱动教程(Win10通用)
  12. 手机三十分钟熄屏如何一直亮_怎么让手机屏幕一直亮着
  13. 【福利】论机房如何关闭方正软件保护卡
  14. win2008虚拟化服务器配置,玩转Windows Server 2008自带的虚拟化功能
  15. 使用 Roadrunner 为 PHP 程序加速
  16. linux构建lamp的关键步骤,Linux-LAMP平台搭建详解
  17. 百钱百鸡 公鸡5文钱一只,母鸡3文钱一只,小鸡3只一文钱
  18. `英语` 2022/8/23
  19. Linux和Windows系统基础操作命令
  20. springcloud(瞿永超著)学习记录(更新中)

热门文章

  1. Java笔记-使用ServerSocket构建HTTP服务器
  2. QML笔记-2种方式实现心脏跳动
  3. 用t430搭建虚拟服务器教程,T430完美使用VmWare
  4. 界面上下固定_【技术浅析】三通道机床自动上下料控制方法应用
  5. war 发布后页面不更新_吐槽 | 都发布一万年了,这游戏还不“更新”?
  6. python 速度 memmap_从20秒到0.5秒:一个使用Rust语言来优化Python性能的案例
  7. 面试题3:二维数组中的查找
  8. LeetCode 153 寻找旋转排序数组中的最小值
  9. JS 日期对象常用函数(时间常用函数、日期格式化)
  10. golang编译工具LiteIDE的调试使用方法(F5)