大数据技术与应用实验报告3

用JAVA写一个WordCount例子,并生成jar包运行于集群上

编写MapReduce程序

MapReduce

1.编程调试WordCount程序
2.生成jar包,在虚拟机上运行

首先我在Eclipse中新建java项目,项目建成后,src文件时是空的,接下来右键单击src新建包和类,然后就进入Wordcount程序的代码编写阶段,导入jar包

导入后不再报错,下一步就是生成jar文件。

右键单击包,选择Export–>Java–>JAR file–>next,输入jar文件的文件名和生成路径,连点两次next后,进入如下界面,选择程序主类,然后点击finish结束。

将生成的jar文件上传到namenode节点,然后在此路径下执行如下命令 hadoop jar wordcount_test.jar /input/text.txt /output4。在jar文件后面输入主类名,至此成功完成本地开发MapReduce程序后,生成jar包发送给集群运行的测试过程。

大数据技术与应用实验报告3相关推荐

  1. 大数据技术与应用实验报告1

    大数据技术与应用实验报告1 Hadoop的安装配置.运行一个WordCount 例子 根据文件里的word文档以及百度的教程进行一下的安装配置(包括后面的实验需要的) 1.VMWare Worksta ...

  2. 大数据技术与应用实验报告2

    大数据技术与应用实验报告2 HDFS常用shell命令的使用,以及用JAVA API实现HDFS常用shell命令的功能 实现上传文件,下载文件 实现上传和下载文件的主要的shell命令 把本地文件上 ...

  3. 大数据技术与应用实验报告4

    大数据技术与应用实验报告4 Hbase的安装.配置以及进行使用 环境: Linux  ubuntu 16.04 jdk-1.8.0_144 hadoop-2.8.3 hbase-1.2.6 在已安装好 ...

  4. 大数据技术与应用实验报告5

    大数据技术与应用实验报告5  NoSQL数据库的简单使用(Redis,MongoDB等) 安装Redis: 1,redis的安装环境需要安装gcc(编译依赖gcc) yum install gcc-c ...

  5. 熟悉大数据存储基础(实验报告)

    [实验与思考] 实验目的 (1) 熟悉大数据存储基础 (2)熟悉大数据技术的基本概念 (3)熟悉开源技术及其商业支援熟悉分布式系统,了解hadoop分布式处理技术 (4)熟悉大数据的数据处理基础知识, ...

  6. 大数据技术基础实验十三:Kafka实验——订阅推送示例

    大数据技术基础实验十三:Kafka实验--订阅推送示例 文章目录 大数据技术基础实验十三:Kafka实验--订阅推送示例 一.前言 二.实验目的 三.实验要求 四.实验原理 1.Kafka简介 2.K ...

  7. 大数据技术基础实验三:HDFS实验——部署HDFS

    大数据技术基础实验三:HDFS实验--部署HDFS 文章目录 大数据技术基础实验三:HDFS实验--部署HDFS 一.前言 二.实验要求 三.实验原理 1.什么是HDFS? 2.HDFS的体系结构 3 ...

  8. FinTech研发报告-之大数据技术

    前序: 手记血泪史:2016年底~2017年是自己技术生涯的元年,所以逼着自己写一般书籍(原打算,后来发现自律性和俗事太多最后没有实现),当时一直关注FinTech个方面的内容,所以决定先写大数据方面 ...

  9. Hadoop十岁!Doug Cutting成长史+他眼中大数据技术的未来

    上次见到(膜拜)Hadoop之父Doug Cutting是在2年前,2014中国大数据技术大会上.今年Hadoop10岁,刚看到他的Hadoop十周年贺词,感觉时间飞逝.最近CSDN和InfoQ都在制 ...

最新文章

  1. 老李分享:jvm垃圾回收
  2. eclipse 快捷键汇总
  3. 【CoppeliaSim】远程 API 之 Matlab 控制,对比 V-rep 有些不同
  4. mootools 简介
  5. 选择排序算法python
  6. 各种搜索算法比较--2015年7月26日16:42:45V1.0版
  7. python第三周笔记_Python第四周 学习笔记(1)
  8. boa+php 嵌入式,boa 0.94.13 在嵌入式平台的安装与配置
  9. 深入理解C语言指针的奥秘-4
  10. 19【推荐系统13】FNN——TensorFlow2实现
  11. DO Global亮相DMEXCO 2018,发布全新智能DSP
  12. python 折线图 百分比_Python数据可视化 - 使用Matplotlib库绘制点图、折线图、条状图与饼图...
  13. HTTP 状态码502 深度解析
  14. 软件开发工具【四】 之 软件开发工具的技术要素
  15. PCB板-叠层详细介绍
  16. 黑暗爆炸 #1059. [ZJOI2007]矩阵游戏
  17. 程序设计第二十二题 空心三角形
  18. 【stm32f407】时钟树以及SystemInit剖析
  19. Excel 2010 VBA 入门 138 添加选项卡和内置控件
  20. 敏捷开发绩效管理系列之八:阿米巴经营之序言

热门文章

  1. 专线网络故障排查本地网络故障排查
  2. css 图片切换模版
  3. gmail邮箱延迟收到问题
  4. 计算机楼综合布线设计图,宿舍楼综合布线设计含图.doc
  5. Markdown基本使用
  6. 如何把FLAC+CUE刻录成CD
  7. php插入友情链接,PHP_详解WordPress中添加友情链接的方法,友情链接对于一个每个独立博 - phpStudy...
  8. 从瀑布开发模式到敏捷开发模式(scrum)的思路转换
  9. LeetCode算法题解 414-第三大的数
  10. mysql统计数量函数方法_mySql关于统计数量的SQL查询操作