目录

一、首先要创建表:在txt记事本中先输入创建语句备用,创建class1~class5的表。

二、启动hadoop集群,MySQL,hive。

三、创建数据库zhh,用户为zhh,之后将之前写在txt记事本里的创建表class1~class5的命令复制到hive当中:

四、将txt里的数据上传到/data/zhh/class1(class1~class5依次进行)

五、相关大数据分析要求:


一、首先要创建表:在txt记事本中先输入创建语句备用,创建class1~class5的表。

create table class5(num String comment'this is the xuhao of students',xuehao String comment 'this is the xuehao of students',name String comment 'this is the name of student',banji String comment 'this is the banji of students',kqbxcj String comment 'this is the kaoqinbiaoxianchengji of students',pszycj String comment 'this is the pingshizuoyechengji of student',qimocj String comment 'this is the qimochengji of student',zhcj String comment'this is the zonghechengji of students')row format delimited fields terminated by ',' stored as textfilelocation '/data/zhh/class5';

二、启动hadoop集群,MySQL,hive。

相关命令:

start-all.sh

mysql5.7/support-files /mysql.server start

Hive

三、创建数据库zhh,用户为zhh,之后将之前写在txt记事本里的创建表class1~class5的命令复制到hive当中:

四、将txt里的数据上传到/data/zhh/class1(class1~class5依次进行)

命令:hdfs dfs -put class01.txt  /data/zhh/class

五、相关大数据分析要求:

1、查询2019级1班ETL技术期末考试的综合分数80分以上的学生信息(含80分)。

命令:select *from class1 where zhcj>=80;

2、查询2019级1班ETL技术期末考试考试成绩90分以上的学生信息(含90分)。

 命令:select *from class1 where qimocj>=90;

3、统计2019级1班ETL技术期末考试成绩70分以上的学生人数(含70分)。

命令:select count(*) from class1 where qimocj>=70;

4、统计2019级2班ETL技术期末考试成绩及格的学生人数。

命令:select count(*) from class2 where qimocj>=60;

5、统计2019级1班参加ETL技术考试的学生总人数(序号数即为人数则课使用num为关键字查询)。

命令:select count(num) from class1;

6、统计2019级2班参加ETL技术考试的学生总人数。

命令:select count(num) from class2;

7、统计2019级3班参加ETL技术考试的学生总人数。

命令:select count(*) from class3;

8、统计2019级4班参加ETL技术考试的学生总人数。

命令:select count(*) from class4;

9、统计2019级数据科学与大数据技术全年级的学生总人数。

命令:select count(*) from class5;

10、查询2019级全年级ETL技术的期末考试成绩80分及以上的学生信息。

命令:select * from class5 where qimocj>=80;

11、查询2019级全年级ETL技术的期末综合成绩85分及以上的学生信息。

命令:select * from class5 where qmcj>=85;

12、统计2019级全年级ETL技术的期末综合成绩86分及以上的学生的总人数。

命令:select count(zhcj>=86) from class5 ;

13、查询2019级数据科学与大数据技术1班吉苇同学的学号、以及所有成绩。

命令:select xuehao,name,kqbxcj,qimocj,zhcj from class1 where name=”吉苇”;

14、查询2019级数据科学与大数据技术2班彭艳同学的学号、以及所有成绩。

命令:select xuehao,name,kqbxcj,qimocj,zhcj from class2 where name=”彭艳”;

15、统计2019级1班ETL技术的期末综合成绩不及格的学生人数。

命令:select count(*) from class1 where zhcj>=60;

16、统计2019级全年级ETL技术的期末综合成绩不及格的学生人数。

命令:select count(*) from class5 where zhcj<60;

17、分析出2019级全年级ETL技术的期末考试成绩分布在70-85分之间的学生信息。

命令:select * from class5 where qimocj between 70 and 85;

18、分析出2019级1班ETL技术的期末考试成绩分布在70-79分之间的学生信息。

命令:select * from class1 where qimocj between 70 and 79;

19、分析出2019级2班ETL技术的期末考试成绩分布在60-69分之间的学生信息。

命令:select * from class2 where qimocj between 60 and 69;

20、统计2019级数据科学与大数据技术全年级学生的期末综合成绩80分以上的学生人数(含80分)。

命令:select count(*) from class5 where qimocj>=80;

结束!

使用hive进行大数据项目分析相关推荐

  1. 给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)...

    不多说,直接上干货! 这个很简单,在集群机器里,选择就是了,本来自带就有Impala的. 扩展博客 给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 欢迎大 ...

  2. 【Hive】大数据的排序和拼接

    目录 一.前言 二.样例SQL 三.函数用法 四.思路解析 一.前言 在大数据开发中有时会有这样的需求:将多条数据中的某个字段通过排序拼接为一个字段. name oid 赵一 80 钱二 190 孙三 ...

  3. 连接端口 配置hive_Hadoop大数据平台数据仓库Hive管理操作

    #大数据# #hadoop# #Hive# #数据仓库# #大数据平台# HWI是Hive Web Interface的简称,在Hive的安装包中默认不提供,需要下载源码编译后运行. 1.1 Hive ...

  4. 查询hive表_大数据中Hive与HBase的区别与联系

    二者区别 Hive:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能. Hive本身不存储和计算数据,它完全依赖于HDFS和MapRe ...

  5. 大数据入门教程系列之Hive内置函数及自定义函数

    本篇文章主要介绍Hive内置函数以及自定义UDF函数和UDFT函数,自定义UDF函数通过一个国际转换中文的例子说明. 操作步骤: ①.准备数据和环境 ②.演示Hive内置函数 ③.自定义UDF函数编写 ...

  6. 大数据基础之Hive(四)—— 常用函数和压缩存储

    作者:duktig 博客:https://duktig.cn (文章首发) 优秀还努力.愿你付出甘之如饴,所得归于欢喜. 更多文章参看github知识库:https://github.com/dukt ...

  7. 大数据开发之Hive篇12-Hive正则表达式

    备注: Hive 版本 2.1.1 文章目录 一.Hive 正则表达式概述 1.1 字符集合: 1.2 边界集合: 1.3 重复次数集合: 1.4 组合操作符: 1.5 匹配操作符: 1.6 转义操作 ...

  8. 大数据系列之数据仓库Hive命令使用及JDBC连接

    Hive系列博文,持续更新~~~ 大数据系列之数据仓库Hive原理 大数据系列之数据仓库Hive安装 大数据系列之数据仓库Hive中分区Partition如何使用 大数据系列之数据仓库Hive命令使用 ...

  9. 图解大数据 | 海量数据库查询-Hive与HBase详解

    Python微信订餐小程序课程视频 https://edu.csdn.net/course/detail/36074 Python实战量化交易理财系统 https://edu.csdn.net/cou ...

最新文章

  1. linux redis ruby,redisrequiresrubyversion2.2.2的解决方案
  2. python语言可以应用在哪些方面-python应用于哪些方面
  3. 本周不容错过的的9篇NLP论文 | PaperDaily #21
  4. 音视频技术开发周刊(第120期)
  5. docker4dotnet #2 容器化主机
  6. 带出7个“师弟”,支付宝BASIC College的辅导员是个伪90后
  7. 【转】在树莓派上实现人脸识别
  8. django框架 day05
  9. MySQL之数据库多表查询
  10. Apache 首位华人董事吴晟谈开源:我对中国开源短期内是消极的
  11. IP核授权形式:软核、固核和硬核
  12. js切换图片会闪动_javascript 如何实现一个闪烁图片的效果呢?
  13. python pytorch库_一个简单而强大的深度学习库—PyTorch
  14. k近邻法 kd树 平衡kd树
  15. led数码显示控制plc实验_一种LED数码显示的PLC控制程序及方法与流程
  16. 1931CIE基础知识
  17. 移动端H5页面关于软键盘的一些踩坑记录
  18. 学习秦始皇 五招打造无敌团队
  19. openwrt和srun的两三事
  20. 艾永亮:时代的较量,谁在定义四个轮子的未来?

热门文章

  1. 关于oracle怎么保证读一致性
  2. snow flake
  3. 计算机专业介绍 英语文章,计算机专业英语文章
  4. 兜兜的乐扣刷题算法小记(不停更)
  5. 计算机图形学的发展与应用论文,计算机图形学的发展与应用
  6. [REV] 逻辑代数
  7. RD650 raid5 linux,联想RD650服务器Raid5配置图文教程.docx
  8. 判断有向图G是否有根
  9. gcc 优化选项 -O1 -O2 -O3 -Os 优先级,-fomit-frame-pointer(不积跬步无以至千里)
  10. redisgo-ngrok实现内网穿透的管理