测试HDFS写性能

在集群节点上执行如下命令:
[hadoop@hadoop01 mapreduce]$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 128MB

参数说明:

  • jar包名称和集群的版本有关,注意版本。
  • TestDFSIO:jar包中的类名。
  • -write:写数据测试。
  • -nrFiles 10 -fileSize 128MB:写10个文件,每个文件大小128M。

运行结果及说明

  • Throughput mb/sec 11.54:吞吐量11.54M/s。

测试HDFS读性能

在集群节点上执行如下命令:
[hadoop@hadoop01 mapreduce]$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -read -nrFiles 10 -fileSize 128MB

参数说明

  • 同上,不同的是将write改为read。

删除测试读写性能产生的数据

[hadoop@hadoop01 mapreduce]$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar TestDFSIO -clean

使用Sort程序评测MapReduce

1)使用RandomWriter来产生随机数,每个节点运行10个Map任务,每个Map产生大约1G大小的二进制随机数。
[hadoop@hadoop01 mapreduce]$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar randomwriter random-data

2)执行Sort程序
[hadoop@hadoop01 mapreduce]$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.1.3.jar sort random-data sorted-data

3)验证数据是否真正排好序了
[hadoop@hadoop01 mapreduce]$ hadoop jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-jobclient-3.1.3-tests.jar testmapredsort -sortInput random-data -sortOutput sorted-data

Hadoop集群读写性能测试以及MR测试相关推荐

  1. Hadoop集群中HDFS的API测试案例以及MapReduce的多种提交Job方式案例

    这两个案例默认是hadoop集群环境已经搭建好以及IDEA环境也已经配置好 1.HDFS客户端测试案例 1.1.pom依赖 <?xml version="1.0" encod ...

  2. eclipse手动pom本地包_环境篇--Eclipse如何远程连接Hadoop集群调试

    关注 DLab数据实验室 公众号 带你一起学习大数据- 写在前面:最近终于闲下来了,打算把之前了解到的内容整理一下,先从搭建环境开始吧- 现在接触大数据开发的朋友可能直接使用Spark或者其他的查询引 ...

  3. 《Hadoop集群与安全》一2.1 在Hadoop集群中配置操作系统

    本节书摘来自华章出版社<Hadoop集群与安全>一书中的第2章,第2.1节,作者 (美)Danil Zburivsky Sudheesh Narayanan,更多章节内容可以访问云栖社区& ...

  4. Windows下安装Cygwin配置Hadoop集群

    Hadoop集群一般是配置到Linux系统之上,如果电脑用的是Windows系统,那么可以通过虚拟机安装Linux系统或者在Windows上安装Cygwin来模拟Linux环境,从而搭建Hadoop集 ...

  5. Hadoop集群安装和搭建(全面超详细的过程)

    Hadoop集群安装和搭建(全面超详细的过程) 文章目录 Hadoop集群安装和搭建(全面超详细的过程) 前言 一.虚拟机的安装 二.Linux系统安装 1.环境准备 2.虚拟机安装 三.Centos ...

  6. Hadoop中HDFS的Shell操作(开发重点)、启动Hadoop集群、基本语法、常用命令实操、命令大全、-help、-mkdir、-moveFromLocal、-copyFromLocal

    文章目录 6.HDFS的Shell操作(开发重点) 6.1基本语法 6.2命令大全 6.3常用命令实操 6.3.1准备工作 6.3.1.1启动Hadoop集群(方便后续的测试) 6.3.1.2-hel ...

  7. Hadoop-2.8.0集群搭建、hadoop源码编译和安装、host配置、ssh免密登录、hadoop配置文件中的参数配置参数总结、hadoop集群测试,安装过程中的常见错误

    25. 集群搭建 25.1 HADOOP集群搭建 25.1.1集群简介 HADOOP集群具体来说包含两个集群:HDFS集群和YARN集群,两者逻辑上分离,但物理上常在一起 HDFS集群: 负责海量数据 ...

  8. CDH6.0.1环境Hadoop集群性能测试

    本次主要是对新集群的性能测试,测试环境: 系统 环境 台数 CPU 内存 硬盘 Centos7.3 CDH6.0.1 3台 32 64G 16T Hadoop自带的测试工具:Hadoop基准测试 首先 ...

  9. jar包在Hadoop集群上测试(MapReduce)

    本片使用MapReduce--统计输出给定的文本文档每一个单词出现的总次数的案例进行,jar包在集群上测试 1.添加打包插件依赖 <build><plugins><plu ...

最新文章

  1. 谷歌推网页爬虫新标准,开源robots.txt解析器
  2. bootstrap账号和文本框在同一行_实用小工具之整理行
  3. (旧)走遍美国——(三、文化1)
  4. java中事物的注解_编程式事务、XML配置事务、注解实现事务
  5. 【2018.5.19】模拟赛之三-ssl2434 取数【搜索,卡常或记忆化搜索】
  6. CLR Via C# 学习笔记(5) 静态构造函数的性能
  7. 解读自监督学习(Self-Supervised Learning)几篇相关paper -
  8. 12.混淆——介绍,傅里叶变换抽样对,采样和重建_1
  9. pythonATM,购物车项目实战6-用户登录功能的实现
  10. 解决Ubuntu安装tensorflow报错:tensorflow-0.5.0-cp27-none-linux_x86_64.whl is not a supported wheel on this
  11. VS2015安装VBpowerpacks工具箱教程
  12. mw150um 驱动程序win10_水星MW150UM无线网卡驱动下载-水星MW150UM 1.0无线网卡驱动官方版下载[电脑版]-华军软件园...
  13. 华为自带浏览器书签删除了怎么恢复_1 秒钟,这个工具能导出你浏览器全部重要数据...
  14. html5 预渲染,VUE预渲染及遇到的坑
  15. 自信转运--《奇迹男孩》
  16. VB.net开发微信、支付宝扫码支付源码
  17. 普通运维人员真的就是秋后的蚂蚱吗?
  18. ajax调用ajax_AJAX即将到来
  19. 怎么自测植物神经紊乱
  20. 数据分析师常见的7道面试题

热门文章

  1. 大一计算机在线测试,计算机在线测试
  2. C/C++数据结构——虚虚实实(并查集欧拉路)
  3. 《寒江独钓windows内核安全编程》学习笔记之一
  4. 关于POE的知识都在这里了
  5. Mongodb入门(CRUD与安装)
  6. 【日麻雀魂】何切300问 维持最大牌效
  7. 【原创】2009年8月25日老谷项目管理MSN群专题—敏捷生态
  8. C# 程序集(Assembly)
  9. markdown文档管理工具
  10. 你怎么看欧阳娜娜空降阿里p8?