文章目录

  • 一、实验环境
  • 二、实验内容
    • 安装Hive环境
    • HiveQL练习
    • 词频统计
  • 出现的问题

一、实验环境

  1. 操作系统:Linux(与实验1保持一致);
  2. Hadoop版本:3.3.1;
  3. JDK版本:1.8;
  4. Hive版本:3.1.2

二、实验内容

安装Hive环境

  1. 完成Hive安装,根据实验1所安装的Hadoop模式,选择Hive的配置模式;
  2. 将Hive的配置文件详细清单列出;
















HiveQL练习

classid
dz1955001001
dz1955001001
dz1955001002
dz1955001002
dz1955002001
dz1955002001
dz1955002002
dz1955002002
dz1955003001
dz1955003001
dz1955003002
dz1955003002
dz1955004001
dz1955004001
dz1955004002
dz1955004002
完成以下操作:
1.创建数据库(自己命名),score为内部表,unit_name为外部表,并加载数据。





2.查询所有同学的语数英成绩

3.查看score表前十行数据

4.查看score表中不同的班级号

5.查看数学成绩及格的所有同学信息

6.查看各个班英语、数学成绩平均分

7.查看dz1955001002班的学生及语文成绩,并降序排序

8.查看语文平均成绩大于80的班级

词频统计

重新使用实验2下载的英文短文,编写HiveQL程序,完成词频统计。要求给出代码及具体注释,程序运行结果截图。


出现的问题

1.hive的使用。

解决办法:
对于hive的使用,在hadoop集群里,先启动hadoop集群,再启动mysql服务,然后,再hive即可。
  1、在hadoop安装目录下,sbin/start-all.sh。
  2、在任何路径下,执行service mysql start (CentOS版本)、sudo /etc/init.d/mysql start (Ubuntu版本)
  3、在hive安装目录下的bin下,./hive。

【大数据技术】实验3:熟悉常用的Hive操作相关推荐

  1. HBase的编程实践(实验3_熟悉常用的HBase操作)

    一.Hbase中使用Shell命令: ① HBase中创建表:(create 命令:第一个变量是表名,然后是列族名) 语法:create '表名称','列族名称1','列族名称2','列族名称N' c ...

  2. 实验一 熟悉常用的Linux操作,实验2-熟悉常用的HDFS操作

    <实验2-熟悉常用的HDFS操作>由会员分享,可在线阅读,更多相关<实验2-熟悉常用的HDFS操作(5页珍藏版)>请在人人文库网上搜索. 1.实验2熟悉常用的HDFS操作1 实 ...

  3. 实验一 熟悉常用的Linux操作和Hadoop操作

    文章目录 题目 实验环境 实验内容 熟悉常用的Linux命令 安装Hadoop 安装ssh服务端 安装Java环境并设置环境变量 安装单机Hadoop hadoop伪分布式安装 出现的问题 but t ...

  4. 西北工业大学软件学院大数据技术实验(一)

    1.服务器信息介绍 学校服务器地址为:10.13.0.21~10.13.0.29,每一个IP对应着是不同配置的主机.现在拿位于10.13.0.22节点上的主机配置进行介绍: CPU:是由Intel专用 ...

  5. 大数据-实验2 熟悉常用的HDFS操作

    1.向HDFS中上传任意文件,如果指定的文件在HDFS中已经存在,由客户指定是追加到原有文件末尾还是覆盖原有文件. 首先,打开Hadoop系统,进入Hadoop下,但是当你输入以Hadoop开头的命令 ...

  6. 合肥工业大学2022大数据技术实验一

    实验序号及名称:实验 一    安装Hadoop 实验时间∶ 2022年5月8日 预习内容 一.实验目的和要求∶ 在虚拟机上安装并熟悉Hadoop 二.实验任务∶ 请各位同学完成如下3个实验中的1个, ...

  7. 合肥工业大学2022大数据技术实验二

    实验序号及名称:实验二 在Hadoop平台上部署WordCount程序实验时间∶ 2022年5月14日 预习内容 一.实验目的和要求∶ 在Hadoop平台上部署WordCount程序. 二.实验任务∶ ...

  8. 大数据技术原理与应用 实验6 Spark数据处理系统的搭建

    目录 一.实验题目 二.实验目的 三.实验平台 四.实验内容和要求 1.Spark RDD部分: 2.Spark SQL部分(分别使用Spark SQL API和Spark DataFrames AP ...

  9. hdfs的实验总结_实验2-熟悉常用的HDFS操作.doc

    本文档下载自 文库下载网, /doc/d52aebffbb0d4a7302768e9951e79b896802689c.html 实验2-熟悉常用的HDFS操作 实验2熟悉常用的HDFS操作 1实验目 ...

  10. 大数据技术与应用实验报告2

    大数据技术与应用实验报告2 HDFS常用shell命令的使用,以及用JAVA API实现HDFS常用shell命令的功能 实现上传文件,下载文件 实现上传和下载文件的主要的shell命令 把本地文件上 ...

最新文章

  1. cvGetSubRect与cvMul用法
  2. 用Fiddler抓取手机APP数据包
  3. 003_JavaScript实现
  4. 8天学通MongoDB——第四天 索引操作
  5. 阿里云入选 2021 Gartner APM 魔力象限,国内唯一入选云厂商
  6. [caffe解读] caffe从数学公式到代码实现1-导论
  7. Java throws子句
  8. Mysql捕捉(网站)应用执行的语句
  9. paros web中间件攻击、扫描、监控
  10. 【华为云技术分享】云图说 | 云硬盘还可以共享?!不了解你就out了
  11. 雨田计算机老师,你们感觉雨田最好的老师是谁?
  12. Java学习笔记四——运算符
  13. python窗口大小动态变化_python – 如何让tkinter画布动态调整窗口宽度?
  14. 2017php类库,AMQB官方PHP库
  15. CHIP-Seq数据分析流程
  16. jmp怎么做合并的箱线图_基于JMP 15的箱线图(Box Plot)的着色
  17. pandas从时间序列中判断是一周的第几天或星期几
  18. H.264 NAL语法语意以及字节流的语法语意
  19. ConcurrentHashMap的锁
  20. Think twice, code once.

热门文章

  1. linux下查看进程占用网络,linux怎么查看进程占用端口
  2. TCP/IP路由技术第一卷动态路由知识回顾
  3. 优化机场值机体验之护照阅读器
  4. ADSL共享方法总结(转)
  5. 欧美风游戏音乐的特点
  6. DHTML 页面对象属性
  7. 520情人节告白❤HTML+CSS+JavaScript实现抖音流动爱心
  8. 未能连接一个windows服务器,Win7出现未能连接一个Windows服务的解决办法
  9. mysql 实例结构体_C语言结构体实例-创建兔子
  10. 智能手机基于众包的室内定位