一. 选择题
1.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤中进行的?( C )
A、频繁模式挖掘
B、分类和预测
C、数据预处理
D、数据流挖掘

2.为数据的总体分布建模,把多维空间划分成组属于数据挖掘的哪一类任务?( B )
A、探索性数据分析
B、建模描述
C、预测建模
D、寻找模式和规则

  1. mapreduce与hbase的关系,哪些描述是正确的?( B,C )
    A、两者不可或缺,mapreduce是hbase可以正常运行的保证
    B、两者不是强关联关系,没有mapreduce,hbase可以正常运行
    C、mapreduce可以直接访问hbase
    D、它们之间没有任何关系

4.下面关于hbase描述错误的是( A )
A、client访问hbase上的数据需要访问master
B、master仅维护表和region的元数据
C、hlog主要用于灾难恢复
D、client检索数据时,先检索memstore,找不到再检索storefile

  1. 关于hbase描述正确的是( A )
    A、hbase表中的每个列,都归属某个列族
    B、列族和列是表的schema的一部分,必须在建表时指定
    C、hbase在磁盘上按照列族存储数据
    D、列族里的元素最好具有相同的读写方式,以提高性能

6.代码select ceil(2.34)的结果是哪一个:( C )
A、2.3
B、2
C、3
D、2.4

7.下面关于Hive内外表描述错误的是( A )
A、Hive内表的元数据和数据都由Hive自己管理
B、Hive会管理外表的元数据
C、当Hive内表的元数据发生变化时,内表的改动修改不会同步给元数据
D、对外部表的表结构和分区进行修改,需要修复

8.关于Hive中窗口函数下列描述正确的是(D)
A LAG用于统计窗口内往上第n行值,空不计入窗口中
B LEAD用于统计窗口内往下第n行值,空不计入窗口中
C FIRST_VALUE取分组排序后,截止到当前行的第一个值
D LAST_VALUE取分组不需要指定ORDER BY后,截止到当前行的最后一个值

9.下面哪个不是Spark RDD的特点( C )
A、可分区
B、可序列化
C、可修改
D、可持久化

10.Task运行在下来哪里个选项中Executor上的工作单元( C )
A、Driver program
B、spark master
C、worker node
D、Cluster manager

二.填空题
1.HIVE的本质是:将HQL转化为___MapReduce___程序。
2.Hive 处理的数据存储在___HDFS____上。
3.HIVE有三种复杂数据类型,它们分别是__array________、map_____和_______struct__。
4.可以使用___ CAST_________操作进行显式数据类型转换。
5.可以使用__EXTERNAL___关键字创建一个外部表。
6.可以使用__LIMIT___关键字来限制返回的行数
7.用户自定义函数类别可分为以下三种:_____ UDF____、UDAF___和UDTF。
8.我们可以使用_EXPLAIN____关键字查看查询语句的执行计划。
9.除了MapReduce之外,HIVE支持的计算引擎还有__ TEZ______________和spark
10. HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有 高容错、高可靠性、高可扩展性、高吞吐率 等特征,适合的读写任务是__________一次写入,多次读写
_________。

2022 大一大二基础hive考试题相关推荐

  1. 大四阶段的社会实践的主要目的是_疫情当前,大三大四的学生“很惨”?大一大二的学生也别松懈...

    大四毕业生不容易 这次疫情对于高校学生而言,可以说是各有各的难处,"这届毕业生很惨"更是屡上热搜.不可否认,大四毕业生确实很不容易,论文答辩.毕业.求职就业等都受到了影响,虽然有困 ...

  2. 大一大二的计算机专业同学应该学习什么?如何学习?

    本文是回答一位知友的提问: 已经大一下了 现在在学 C++ 感觉书上很多术语都不懂 编程自己也得花很多时间才能做出来,但感觉自己身边的同学却什么都会.有什么好的建议吗?我一定努力改正 正文 一.可能的 ...

  3. 2022年资料员-通用基础(资料员)考试题及答案

    题库来源:安全生产模拟考试一点通公众号小程序 2022资料员-通用基础(资料员)题库是资料员-通用基础(资料员)考试100题模拟预测卷!2022年资料员-通用基础(资料员)考试题及答案依据资料员-通用 ...

  4. 博客人少的原因(给大一大二同学说的)

    昨天看见了一篇博客,询问自己博客访问量几百原因,我去看了他所有的博客,大多数都是循环了,数据结构的一些例子,很明显是个大二学生,有的内容写的也不算差,但是访问量少原因很好找了,你写的这些文章从业者偶尔 ...

  5. 大一大二的小设计作品集合(yuan)

    大一大二的小设计作品集合(yuan) 科技作品show

  6. 西油大一大二在南充磨练意志,去成都后变得坚强自信,毕业后西油学生就很好找工作...

    那天在网上收了一收西南石油大学,结果就收到这篇文章,因为我也是西南石油大学07级毕业生,就转过来了. 西油大一大二在南充磨练意志,去成都后变得坚强自信,毕业后西油学生就很好找工作. 还有就是我不同意下 ...

  7. 计算机专业大一大二该怎样提升自己的专业技能?

    2017,我研三,是忙碌的一年,从年初备战实习春招,年三十都在死磕JDK源码,三月份经历了阿里五次面试,四月顺利收到实习offer.然后五月怀着忐忑的心情开始了蚂蚁金服的实习.八月,又经历了两轮面试, ...

  8. 大数据框架基础Hive安装

    所有Hadoop的子项目,如Hive, Pig,和HBase 支持Linux的操作系统.因此,需要安装Linux OS.以下是为Hive的安装执行的简单步骤: 第1步:验证JAVA安装 在Hive安装 ...

  9. 想对大一大二学生说一些心里话

    相信看到这个的时候,大家的大学生活不知不觉已经开启了好几个月了甚至一年已经过去了,不知道大家收获了多少,是否与室友相处愉快?有没有交到女朋友或者男朋友开启一段大学恋爱?专业知识是否学的扎实?大学真的跟 ...

最新文章

  1. 二分查找--AVL查找树
  2. 模式识别与机器学习课程笔记——决策树和贝叶斯估计
  3. 世界杯29场点球大战的269个点球数据都在这里!霍金的公式帮了英格兰吗?
  4. Mr.J-- jQuery学习笔记(二十九)--属性操作方法(获取属性判断)
  5. 【tools第3期】VsCode根据模板生成代码
  6. DIV+CSS样式表命名的规则方法
  7. PHPWAMP开机自启异常,服务器重启后Apache等服务不会自启的原因分析
  8. Matlab入门:界面认识
  9. solr配置索引库启动tomcat报错记录及解决
  10. java程序设计课后答案 刘慧宁_【单选题】建筑立面图中,室外地坪轮廓线应用( )。...
  11. Glide导致的RuntimeException: Canvas: trying to use a recycled bitmap android.graphics.Bitmap
  12. 用特征根判别法判断AR模型的平稳性,再用随机模拟的方法来验证以及做自相关分析
  13. 2021年北京高考成绩排名查询,北京2021高考成绩排名榜单,北京各高中高考成绩喜报...
  14. Binder基石-Parcel
  15. jdon(jdong)
  16. Uber vs. Lyft
  17. 安卓TextView实现文字跑马灯(失去焦点可用)
  18. 巴比特国际站观察 | 海外新晋“网红”亮相,数字人民币引密码社区热议
  19. 运筹帷幄的“懒蚂蚁”
  20. 蓝牙触摸板键盘延迟卡顿断连的问题

热门文章

  1. A4纸尺寸大小是多少
  2. 万维网www/web —— Tim Berners-Lee理念:建立全球范围信息网,彻底打破信息存取壁垒(网页相互链接,URL,HTTP,HTML,CGI等)
  3. 浅谈IT行业中的隐私泄露问题
  4. 京东区块链技术实践白皮书2020
  5. Ubuntu使用gzip与bzip2与rar和tar压缩解压
  6. 还我一个干净的Mac OS(如何彻底删除不需要的App)
  7. CCF-野外环境中的蝴蝶自动识别-排名54
  8. 论文投稿指南——中文核心期刊推荐(物理学)
  9. 人工智能与智能的异同
  10. 一位卖家对淘宝查杀虚假交易痛讼!