1、测试HDFS写性能

向HDFS集群写10个128M的文件

cd /data/hadoop/hadoop/
bin/hadoop jar /data/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.7.2-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 128MB

参数代表含义:

  • Number of files: 10:文件数量为10
  • Total MBytes processed: 1280 :总写入数据量为1280MB
  • Throughput mb/sec: 3.59 : 【总共需要写入的数据量】 /【每个map任务实际写入数据的执行时间之和】(这个时间会远小于Test exec time sec) 。这里也就是 【1280】/【(map1写时间+map2写时间+…)】
  • Average IO rate mb/sec: 17.03 :【每个map需要写入的数据量除以每个map任务实际写入数据的执行时间的和】/ 【任务数】,所以这个值跟上面一个值总是存在差异。这里就是:【(文件大小/map1写时间+文件大小/map2写时间+…)】/ 【任务数】
  • IO rate std deviation: 19.67 :上一个值的标准差,可以理解成方差;方差越小越稳定,有点像cpu的低压版和高压版
  • Test exec time sec: 112.25 :整个job任务的执行时间

Throughput mb/sec :衡量每个map task的平均吞吐量。
Average IO rate mb/sec :衡量每个文件的平均IO速度。

2、测试HDFS读性能

读取HDFS集群10个128M的文件

bin/hadoop jar /data/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.7.2-tests.jar TestDFSIO -read -nrFiles 10 -fileSize 128MB


参数代表含义:同上

3、删除测试生成数据

bin/hadoop jar /data/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.7.2-tests.jar TestDFSIO -clean

4、使用Sort程序测试MapReduce

如果是学习测试就不要做了,笔记本可能会有点扛不住;可以在物理机或阿里云主机上测试。

  • 使用RandomWriter来产生随机数,每个节点运行10个Map任务,每个Map产生大约1G大小的二进制随机数

    bin/hadoop jar /data/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar randomwriter random-data

  • 执行Sort程序

    bin/hadoop jar /data/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar sort random-data sorted-data

  • 验证数据是否真正排好序了

    bin/hadoop jar /data/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-2.7.2-tests.jar testmapredsort -sortInput random-data -sortOutput sorted-data

测试hadoop集群的读写与计算能力相关推荐

  1. Ubuntu Server 12.04 搭建 hadoop 集群版环境——基于VirtualBox

    1 . 下载和安装Oracle VM VitualBox http://www.oracle.com/technetwork/server-storage/virtualbox/downloads/i ...

  2. VMware Workstation 9下基于Ubuntu 12.10服务器版本的Hadoop集群的配置

    (主要参照http://os.51cto.com/art/201211/363116.htm) 一.概述 其实,网上关于Hadoop集群的配置的资料不可谓不少,但是,细细找来,多半是在有图形桌面的环境 ...

  3. [零基础]用docker搭建Hadoop集群

    目录 前言:为什么要用docker搭建Hadoop集群? 准备:下载VMware.VMwareTools(或Xftp.Xshell).Ubuntu或者CentOS映像文件.Hadoop和jdk压缩包 ...

  4. Hadoop集群搭建教程(详细)

    需要的安装包: 1.jdk压缩包 2.hadoop压缩包 请前往百度云上上下载相关安装包(密码:8op1) 开始搭建hadoop集群 一.使用VMvare创建两个虚拟机,我使用的是ubuntu16.0 ...

  5. Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

    25. 集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据 ...

  6. Hadoop集群中HDFS的API测试案例以及MapReduce的多种提交Job方式案例

    这两个案例默认是hadoop集群环境已经搭建好以及IDEA环境也已经配置好 1.HDFS客户端测试案例 1.1.pom依赖 <?xml version="1.0" encod ...

  7. ogg oracle 测试kafka_基于OGG的Oracle与Hadoop集群/kafka准实时同步

    Oracle里存储的结构化数据导出到Hadoop体系做离线计算是一种常见数据处置手段.近期有场景需要做Oracle到Hadoop体系的实时导入,这里以此案例做以介绍. Oracle作为商业化的数据库解 ...

  8. jar包在Hadoop集群上测试(MapReduce)

    本片使用MapReduce--统计输出给定的文本文档每一个单词出现的总次数的案例进行,jar包在集群上测试 1.添加打包插件依赖 <build><plugins><plu ...

  9. 大数据:Hadoop集群测试

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 Hadoop集群测试 通过UI界面查看Hadoop运行状态 一.hadoop2和hadoop3端口区别表 2.查看HDFS集群状态 查 ...

最新文章

  1. 【实用】SAP MR8M校验增强
  2. 包邮送50本畅销书,值得阅读!
  3. Remoting简介
  4. synchronized 底层了解一下...
  5. js如何判断访问来源是来自搜索引擎(蜘蛛人)还是直接访问
  6. wdcp 开启某个Mysql数据库远程访问
  7. 算法导论7:选择算法和数据结构准备 2016.1.7
  8. 微信小程序云开发教程-WXSS入门-常用样式
  9. pdf照片显示正常打印时被翻转_【20考研】现场确认完没事了?!准考证打印别大意!...
  10. 浙江日报软件测试怎么样,浙江日报
  11. 电动汽车的数据记录 BMS
  12. 计时器、倒计时、打点计时器
  13. 51 个漂亮的电子商务网站设计分享
  14. Caffe windows下安装攻略
  15. 小米9刷鸿蒙,小米手机怎么刷机 小米9刷第三方ROM方法【详解】
  16. Javaweb分页技术实现
  17. 海康威视产品的token更新
  18. 联想ghost重装系统_联想电脑怎么重装系统的方法
  19. 吉布斯采样(Gibbs Sampling)及相关算法
  20. 25779.html

热门文章

  1. 如何将机器码转换为汇编代码
  2. 虚拟机php安装swoole扩展,Linux下php安装swoole扩展
  3. springboot 启动过程之run
  4. 操作系统中用户态和内核态(系统态)是什么?用户态如何变成内核态?
  5. oracle表空间默认增长大小,Oracle 用户表空间查看、修改大小、设置自增长等
  6. HTML5游戏《被淹没的王国》截图
  7. 常见数据结构及特点介绍
  8. 瑞晟微电子 笔试后记
  9. 投资日记:12.17-12.20(厦门港务)
  10. 2021年中式烹调师(中级)报名考试及中式烹调师(中级)考试总结