【大数据技术】实验3:熟悉常用的Hive操作
文章目录
- 一、实验环境
- 二、实验内容
- 安装Hive环境
- HiveQL练习
- 词频统计
- 出现的问题
一、实验环境
- 操作系统:Linux(与实验1保持一致);
- Hadoop版本:3.3.1;
- JDK版本:1.8;
- Hive版本:3.1.2
二、实验内容
安装Hive环境
- 完成Hive安装,根据实验1所安装的Hadoop模式,选择Hive的配置模式;
- 将Hive的配置文件详细清单列出;
HiveQL练习
classid
dz1955001001
dz1955001001
dz1955001002
dz1955001002
dz1955002001
dz1955002001
dz1955002002
dz1955002002
dz1955003001
dz1955003001
dz1955003002
dz1955003002
dz1955004001
dz1955004001
dz1955004002
dz1955004002
完成以下操作:
1.创建数据库(自己命名),score为内部表,unit_name为外部表,并加载数据。
2.查询所有同学的语数英成绩
3.查看score表前十行数据
4.查看score表中不同的班级号
5.查看数学成绩及格的所有同学信息
6.查看各个班英语、数学成绩平均分
7.查看dz1955001002班的学生及语文成绩,并降序排序
8.查看语文平均成绩大于80的班级
词频统计
重新使用实验2下载的英文短文,编写HiveQL程序,完成词频统计。要求给出代码及具体注释,程序运行结果截图。
出现的问题
1.hive的使用。
解决办法:
对于hive的使用,在hadoop集群里,先启动hadoop集群,再启动mysql服务,然后,再hive即可。
1、在hadoop安装目录下,sbin/start-all.sh。
2、在任何路径下,执行service mysql start (CentOS版本)、sudo /etc/init.d/mysql start (Ubuntu版本)
3、在hive安装目录下的bin下,./hive。
【大数据技术】实验3:熟悉常用的Hive操作相关推荐
- HBase的编程实践(实验3_熟悉常用的HBase操作)
一.Hbase中使用Shell命令: ① HBase中创建表:(create 命令:第一个变量是表名,然后是列族名) 语法:create '表名称','列族名称1','列族名称2','列族名称N' c ...
- 实验一 熟悉常用的Linux操作,实验2-熟悉常用的HDFS操作
<实验2-熟悉常用的HDFS操作>由会员分享,可在线阅读,更多相关<实验2-熟悉常用的HDFS操作(5页珍藏版)>请在人人文库网上搜索. 1.实验2熟悉常用的HDFS操作1 实 ...
- 实验一 熟悉常用的Linux操作和Hadoop操作
文章目录 题目 实验环境 实验内容 熟悉常用的Linux命令 安装Hadoop 安装ssh服务端 安装Java环境并设置环境变量 安装单机Hadoop hadoop伪分布式安装 出现的问题 but t ...
- 西北工业大学软件学院大数据技术实验(一)
1.服务器信息介绍 学校服务器地址为:10.13.0.21~10.13.0.29,每一个IP对应着是不同配置的主机.现在拿位于10.13.0.22节点上的主机配置进行介绍: CPU:是由Intel专用 ...
- 大数据-实验2 熟悉常用的HDFS操作
1.向HDFS中上传任意文件,如果指定的文件在HDFS中已经存在,由客户指定是追加到原有文件末尾还是覆盖原有文件. 首先,打开Hadoop系统,进入Hadoop下,但是当你输入以Hadoop开头的命令 ...
- 合肥工业大学2022大数据技术实验一
实验序号及名称:实验 一 安装Hadoop 实验时间∶ 2022年5月8日 预习内容 一.实验目的和要求∶ 在虚拟机上安装并熟悉Hadoop 二.实验任务∶ 请各位同学完成如下3个实验中的1个, ...
- 合肥工业大学2022大数据技术实验二
实验序号及名称:实验二 在Hadoop平台上部署WordCount程序实验时间∶ 2022年5月14日 预习内容 一.实验目的和要求∶ 在Hadoop平台上部署WordCount程序. 二.实验任务∶ ...
- 大数据技术原理与应用 实验6 Spark数据处理系统的搭建
目录 一.实验题目 二.实验目的 三.实验平台 四.实验内容和要求 1.Spark RDD部分: 2.Spark SQL部分(分别使用Spark SQL API和Spark DataFrames AP ...
- hdfs的实验总结_实验2-熟悉常用的HDFS操作.doc
本文档下载自 文库下载网, /doc/d52aebffbb0d4a7302768e9951e79b896802689c.html 实验2-熟悉常用的HDFS操作 实验2熟悉常用的HDFS操作 1实验目 ...
- 大数据技术与应用实验报告2
大数据技术与应用实验报告2 HDFS常用shell命令的使用,以及用JAVA API实现HDFS常用shell命令的功能 实现上传文件,下载文件 实现上传和下载文件的主要的shell命令 把本地文件上 ...
最新文章
- cvGetSubRect与cvMul用法
- 用Fiddler抓取手机APP数据包
- 003_JavaScript实现
- 8天学通MongoDB——第四天 索引操作
- 阿里云入选 2021 Gartner APM 魔力象限,国内唯一入选云厂商
- [caffe解读] caffe从数学公式到代码实现1-导论
- Java throws子句
- Mysql捕捉(网站)应用执行的语句
- paros web中间件攻击、扫描、监控
- 【华为云技术分享】云图说 | 云硬盘还可以共享?!不了解你就out了
- 雨田计算机老师,你们感觉雨田最好的老师是谁?
- Java学习笔记四——运算符
- python窗口大小动态变化_python – 如何让tkinter画布动态调整窗口宽度?
- 2017php类库,AMQB官方PHP库
- CHIP-Seq数据分析流程
- jmp怎么做合并的箱线图_基于JMP 15的箱线图(Box Plot)的着色
- pandas从时间序列中判断是一周的第几天或星期几
- H.264 NAL语法语意以及字节流的语法语意
- ConcurrentHashMap的锁
- Think twice, code once.