《高可用性的HDFS—Hadoop分布式文件系统深度实践》
基本信息
作者: 文艾 王磊
出版社:清华大学出版社
ISBN:9787302282587
上架时间:2012-5-14
出版日期:2012 年5月
开本:16开
页码:371
版次:1-1
所属分类: 计算机 > 软件与程序设计 > 分布式系统设计

 

更多详情 》》》高可用性的HDFS—Hadoop分布式文件系统深度实践
内容简介
计算机书籍
   《高可用性的hdfs—hadoop分布式文件系统深度实践》专注于hadoop分布式文件系统(hdfs)的主流ha解决方案,内容包括:hdfs元 数据解析、hadoop元数据备份方案、hadoop backup node方案、avatarnode解决方案以及最新的ha解决方案cloudrea ha name node等。其中有关backup node方案及avatarnode方案的内容是本书重点,尤其是对avatarnode方案从运行机制到异常处理方案的步骤进行了详尽介绍,同时还总结 了各种异常情况下avatarnode的各种处理方案。
  《高可用性的hdfs—hadoop分布式文件系统深度实践》从代码入手并结合情景分析、案例解说对hdfs的元数据以及主流的hdfs ha解决方案的运行机制进行了深入剖析,力求使读者在解决问题时做到心中有数,不仅知其然还知其所以然。
  本书光盘包含本书部分操作的视频教程以及所有源代码、脚本等开发文件。
  《高可用性的hdfs—hadoop分布式文件系统深度实践》读者主要为云计算相关领域的研发人员、云计算系统管理维护人员,也适合作为高校研究生和高年级本科生的专业课辅助教材。
目录
《高可用性的hdfs—hadoop分布式文件系统深度实践》
第1章 hdfs ha及解决方案 1
1.1 hdfs系统架构 2
1.2 ha定义 3
1.3 hdfs ha原因分析及应对措施 4
1.3.1 可靠性 4
1.3.2 可维护性 5
1.4 现有hdfs ha解决方案 5
1.4.1 hadoop的元数据备份方案 6
1.4.2 hadoop的secondarynamenode方案 7
1.4.3 hadoop的checkpoint ode方案 7
1.4.4 hadoop的backupnode方案 8
1.4.5 drdb方案 9
1.4.6 facebook的avatarnode方案 10
1.5 方案优缺点比较 10
第2章 hdfs元数据解析 13
2.1 概述 14
2.2 内存元数据结构 14
2.2.1 inode 15
2.2.2 block 16

.2.2.3 blockinfo和datanodedescriptor 17
2.2.4 小结 17
2.2.5 代码分析——元数据结构 18
2.3 磁盘元数据文件 24
2.4 format情景分析 27
2.5 元数据应用场景分析 45
第3章 hadoop的元数据备份方案 47
3.1 运行机制分析 48
3.1.1 namenode启动加载元数据情景分析 50
3.1.2 元数据更新及日志写入情景分析 64
3.1.3 checkpoint过程情景分析 73
3.1.4 元数据可靠性机制 109
3.1.5 元数据一致性机制 110
3.2 使用说明 110
第4章 hadoop的backup node方案 113
4.1 backup node概述 114
4.1.1 系统架构 115
4.1.2 使用原则 115
4.1.3 优缺点 116
4.2 运行机制分析 116
4.2.1 启动流程 117
4.2.2 元数据操作情景分析 141
4.2.3 日志池(journal spool)机制 151
4.2.4 故障切换机制 156
4.3 实验方案说明 158
4.4 构建实验环境 158
4.4.1 网络拓扑 159
4.4.2 系统安装及配置 160
4.4.3 安装jdk 170
4.4.4 虚拟机集群架设 171
4.4.5 namenode安装及配置 173
4.4.6 backup node安装及配置 173
4.4.7 data node安装及配置 174
4.4.8 clients安装及配置 175
4.5 异常解决方案 175
4.5.1 异常情况分析 175
4.5.2 namenode配置 175
4.5.3 backup node配置 182
4.5.4 data node配置 185
4.5.5 namenode宕机切换实验 189
4.5.6 namenode宕机读写测试 196

第5章 avatarnode运行机制 205
5.1 方案说明 206
5.1.1 系统架构 206
5.1.2 思路分析 208
5.1.3 性能数据 209
5.2 元数据分析 209
5.2.1 类fsnamesystem 210
5.2.2 类fsdirectory 210
5.2.3 avatarnode的磁盘元数据文件 211
5.3 avatarnode primary启动过程 211
5.4 avatarnode standby启动过程 217
5.4.1 avatarnode的构造方法 217
5.4.2 standby线程的run()方法 218
5.4.3 ingest线程的run()方法 220
5.4.4 ingest线程的ingestfsedits ()方法 220
5.4.5 standby线程的docheckpoint()方法 221
5.5 用户操作情景分析 223
5.5.1 创建目录情景分析 223
5.5.2 创建文件情景分析 231
5.6 avatarnode standby故障切换过程 240
5.7 元数据一致性保证机制 242
5.7.1 元数据目录树信息 242
5.7.2 data node与block数据块映射信息 243
5.8 block更新同步问题 246
5.8.1 问题描述 246
5.8.2 结论 246
5.8.3 源码分析 246
第6章 avatarnode使用 253
6.1 方案说明 254
6.1.1 网络拓扑 254
6.1.2 操作系统安装及配置 255
6.2 使用avatar打补丁版本 255
6.2.1 hadoop源码联机build 256
6.2.2 hadoop源码本地build 262
6.2.3 nfs服务器构建 264
6.2.4 avatar分发与部署 267
6.2.5 primary(namenode0)节点配置 269
6.2.7 data node节点配置 276
6.2.8 client节点配置 278
6.2.9 创建目录 279
6.2.10 挂载nfs 280
6.2.11 启动ucarp 280
6.2.12 格式化 281
6.2.13 系统启动 281
6.2.14 检查 282
6.2.15 namenode失效切换写文件实验 283
6.2.16 namenode失效切换读文件实验 291
6.3 avatar facebook版本的使用 294
6.3.1 hadoop facebook版本安装 294
6.3.2 节点配置 295
6.3.3 启动hdfs 300
6.3.4 namenode失效切换 302
第7章 avatarnode异常解决方案 305
7.1 测试环境 306
7.2 primary失效 306
7.2.1 解决方案 306
7.2.2 写操作实验步骤 307
7.2.3 改进写操作机制 313
7.2.4 读操作实验步骤 313
7.2.5 小结 317
7.3 standby失效 317
7.4 nfs失效(数据未损坏) 317
7.4.1 解决方案 317
7.4.2 写操作实验步骤 318
7.4.3 读操作实验步骤 320
7.4.4 小结 322
7.5 nfs失效(数据已损坏) 323
7.5.1 解决方案 323
7.5.2 写操作实验步骤 324
7.5.3 读操作实验步骤 327
7.5.4 小结 330
7.6 primary先失效,nfs后失效(数据未损坏) 331
7.6.1 解决方案 331
7.6.2 写操作实验步骤 331
7.6.3 读操作实验步骤 333
7.6.4 小结 334
7.7 primary先失效(数据未损坏),nfs后失效(数据损坏) 335
7.7.1 解决方案 335
7.7.2 写操作实验步骤 335
7.7.3 读操作实验步骤 338
7.7.4 小结 339
7.8 nfs先失效(数据未损坏),primary后失效 340
7.8.1 解决方案 340
7.8.2 写操作实验步骤 340
7.8.3 读操作实验步骤 342
7.8.4 小结 343
7.9 nfs先失效(数据损坏),primary后失效(数据损坏) 344
7.9.1 解决方案 344
7.9.2 写操作实验步骤 344
7.9.3 读操作实验步骤 346
7.9.4 小结 348
7.10 实验结论 348
第8章 cloudera ha namenode使用 349
8.1 ha namenode说明 350
8.2 cdh4b1版本hdfs集群配置 351
8.2.1 虚拟机安装 351
8.2.2 nn1配置 351
8.2.3 dn1~dn3配置 355
8.2.4 hdfs集群构建 358
8.3 ha namenode配置 361
8.3.1 nn1配置 361
8.3.2 其他节点配置 365
8.4 ha namenode使用 367
8.4.1 启动ha hdfs集群 367
8.4.2 第1次failover 368
8.4.3 模拟写操作 368
8.4.4 模拟active name node失效,第2次failover 369
8.3.5 模拟新的standby namenode加入 370
8.5 小结 371
本图书来源:中国互动出版网

转载于:https://www.cnblogs.com/china-pub/archive/2012/05/21/2511779.html

高可用性的HDFS—Hadoop分布式文件系统深度实践相关推荐

  1. hdfs读写流程_深度探索Hadoop分布式文件系统(HDFS)数据读取流程

    一.开篇 Hadoop分布式文件系统(HDFS)是Hadoop大数据生态最底层的数据存储设施.因其具备了海量数据分布式存储能力,针对不同批处理业务的大吞吐数据计算承载力,使其综合复杂度要远远高于其他数 ...

  2. HDFS 全称 Hadoop 分布式文件系统,其最主要的作用是作为 Hadoop 生态中各系统的存储服务。

    HDFS HDFS 全称 Hadoop 分布式文件系统,其最主要的作用是作为 Hadoop 生态中各系统的存储服务. 面对大规模的数据,HDFS 在设计上满足了以下目标: 高度容错性: HDFS 可能 ...

  3. Hadoop分布式文件系统HDFS的工作原理详述

    Hadoop分布式文件系统(HDFS)是一种被设计成适合运行在通用硬件上的分布式文件系统.HDFS是一个高度容错性的系统,适合部署在廉价的机器上.它能提供高吞吐量的数据访问,非常适合大规模数据集上的应 ...

  4. 深入理解HDFS:Hadoop分布式文件系统

    深入理解HDFS:Hadoop分布式文件系统 文本详细介绍了HDFS中的许多概念,对于理解Hadoop分布式文件系统很有帮助. 1. 介绍 在现代的企业环境中,单机容量往往无法存储大量数据,需要跨机器 ...

  5. Hadoop 系列 HDFS:分布式文件系统(HDFS文件读写)

    HDFS:分布式文件系统 HDFS文件读写 文件访问权限 针对文件和目录,HDFS有与POSIX非常相似的权限模式. 一共提供三类权限模式:只读权限(r).写入权限(w)和可执行权限(x).读取文件或 ...

  6. Hadoop分布式文件系统 (HDFS)

    Hadoop分布式文件系统 简介 ​ HDFS(Hadoop distribute file system) 是Hadoop核心组成,是分布式存储服务 ​ 分布式文件系统能够横跨多态计算机.在大数据时 ...

  7. JAVA大数据(二) Hadoop 分布式文件系统HDFS 架构,MapReduce介绍,Yarn资源调度

    文章目录 1.分布式文件系统HDFS 1.HDFS的来源 2.HDFS的架构图之基础架构 2.1 master/slave 架构 2.2 名字空间(NameSpace) 2.3 文件操作 2.4副本机 ...

  8. Hadoop分布式文件系统(HDFS)之文件系统(详细版)

    交朋友增体面,不如交朋友益身心 教子弟求显荣,不如教子弟立品行 推荐书目电子版下载 Hadoop必读书目(精选) 本文参考文献包含于上述书籍 HDFS快速入门 Hadoop分布式文件系统(HDFS)快 ...

  9. Hadoop之HDFS:Hadoop分布式文件系统--具体知识点

    HDFS:Hadoop分布式文件系统 下面是HDFS的具体知识点,个人学习笔记戳这 文章目录 HDFS:Hadoop分布式文件系统 一.学习准备 二.课堂主题 三.课堂目标 四.知识要点 1. had ...

最新文章

  1. SystemCenter2012SP1实践(15)共享库服务器和ISO
  2. 要不要读博?机器学习博五学生和强化学习博士展开了一场battle
  3. Ajax的优缺点以及异步和同步的区别
  4. android圆形图形的设置
  5. RocketMq Producer最佳实践
  6. java中appletviewer是什么意思_Java开发网 - 请教,appletviewer的问题
  7. python代码解读软件_5种带你轻松分析Python代码的软件库
  8. 系统的crontab设定:/etc/crontab
  9. 一、OpenStack架构
  10. android action bar 风格,自定义ActionBar的风格
  11. 推动数字化智能化转型 中关村数智经济发展论坛成功举办
  12. 怎么把框架栏变颜色 html,如何修改easyui框架颜色,求指点_html/css_WEB-ITnose
  13. 技术是如何创造价值的
  14. 如何清理Windows XP冗余文件【绿色系统收藏】
  15. easyUI分页中,如何实现页面跳转,再返回时,仍然到跳转前页数。(含页面显示条数)
  16. 火箭联盟修改车重教程,国服Wegame平台和外服Steam平台通用方法
  17. 项目管理挣值分析应用
  18. 装饰者模式---装饰者模式和桥接模式的区别
  19. socket网络编程常用的结构及函数小结
  20. 保存地理坐标信息的SLIC分割结果

热门文章

  1. [转]vue全面介绍--全家桶、项目实例
  2. 面向对象基础-委托与事件
  3. 高效管理ASP.NET的JavaScript库
  4. C#设计模式(19)——状态者模式(State Pattern)
  5. 使用Server 2008新GPO做驱动器映射
  6. Spring web应用最大的败笔
  7. C# 多个线程一直跑着While(true)
  8. MSBuild编译扩展
  9. 不同技术团队的配合问题及DevOps
  10. 编写优美的GTest测试案例