Spark单元测验

1单选(2分)

Spark SQL目前暂时不支持下列哪种语言

A.Python

B.Java

C.Matlab

D.Scala

2单选(2分)

RDD操作分为转换(Transformation)和动作(Action)两种类型,下列属于动作(Action)类型的操作的是

A.map

B.count

C.groupBy

D.filter

3单选(2分)

下列说法错误的是

A.RDD提供的转换接口既适用filter等粗粒度的转换,也适合某一数据项的细粒度转换

B.Spark支持三种类型的部署方式:Standalone,Spark on Mesos,Spark on YARN

C.在选择Spark Streaming和Storm时,对实时性要求高(比如要求毫秒级响应)的企业更倾向于选择流计算框架Storm

D.RDD采用惰性调用,遇到“转换(Transformation)”类型的操作时,只会记录RDD生成的轨迹,只有遇到“动作(Action)”类型的操作时才会触发真正的计算

4单选(2分)

下列关于常见的动作(Action)和转换(Transformation)操作的API解释错误的是

A.count():返回数据集中的元素个数

B.filter(func):筛选出满足函数func的元素,并返回一个新的数据集

C.take(n):返回数据集中的第n个元素

(应该是前n个)

D.map(func):将每个元素传递到函数func中,并将结果返回为一个新的数据集

5单选(2分)

下列大数据类型与其对应的软件框架不适应的是

A.复杂的批量数据处理:MapReduce

B.基于实时数据流的数据处理:Storm

C.图结构数据的计算:Hive

D.基于历史数据的交互式查询:Impala

6多选(3分)

Apache软件基金会最重要的三大分布式计算系统开源项目包括

A.Storm

B.Hadoop

C.MapReduce

D.Spark

7多选(3分)

Spark的主要特点包括

A.运行模式多样

B.运行速度快

C.通用性

D.容易使用

8多选(3分)

下列关于Scala的说法正确的是

A.Scala是一种多范式编程语言

B.Scala运行于Java平台,兼容现有的Java程序

C.Scala具备强大的并发性,支持函数式编程

D.Scala是Spark的主要编程语言,但Spark还支持Java、Python、R作为编程语言

9多选(3分)

Spark的运行架构包括

A.集群资源管理器 Cluster Manager

B.每个工作节点上负责具体任务的执行进程 Executor

C.运行作业任务的工作节点 Worker Node

D.每个应用的任务控制节点 Driver

10填空(2分)

RDD,中文全称是弹性分布式数据集,是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型。

大数据技术原理与应用第10讲:Spark相关推荐

  1. 大数据技术原理与应用—第10讲 Spark(林子雨老师)课后习题

    以下是慕课上林子雨老师,大数据原理及应用的第十讲习题答案.仅供大家学习参考. 10.RDD,中文全称是 (==弹性分布式数据 ==),是分布式内存的一个抽象概念,提供了一种高度受限的共享内存模型. 多 ...

  2. 大数据技术原理与应用(第十章 Spark)

    目录 10.1 Spark简介 Spark的主要特点 Scala简介 Scala的特性 Spark与Hadoop的对比 Hadoop与Spark的执行流程对比 10.2 Spark生态系统 BDAS架 ...

  3. 大数据技术原理与应用—第1讲 大数据概述(林子雨老师)课后习题

    以下是慕课上林子雨老师,大数据原理及应用的第一讲习题答案.仅供大家学习参考. 第8题:4V指的是:价值密度低,数据量大,数据类型多,处理速度快

  4. 大数据技术原理与应用第11讲:流计算

    流计算秉承一个基本理念,即数据的价值随着时间的流逝而     ,如用户点击流. A.不确定 B.不变 C.降低 D.升高 Hadoop运行的是MapReduce任务,类似地,Storm运行的任务叫做  ...

  5. 大数据技术原理与应用第8讲:数据仓库Hive

    1单选(2分) 下列有关Hive和Impala的对比错误的是 A.Hive适合于长时间的批处理查询分析,而Impala适合于实时交互式SQL查询 B.Hive与Impala中对SQL的解释处理比较相似 ...

  6. 大数据技术原理与应用第4讲:分布式数据库HBase

    1HBase是一种    数据库 A.列式数据库 B.键值数据库 C.文档数据库 D.关系数据库 2下列对HBase数据模型的描述错误的是 A.HBase中执行更新操作时,会删除数据旧的版本,并生成一 ...

  7. [渝粤教育] 厦门大学 大数据技术原理与应用 参考 资料

    教育 -大数据技术原理与应用-章节资料考试资料-厦门大学[] 第1章 大数据概述 单元测验 1.[单选题]第三次信息化浪潮的标志是: A.个人电脑的普及 B.互联网的普及 C.云计算.大数据.物联网技 ...

  8. 大数据技术原理与应用课后题(林子雨)

    大数据技术原理与应用(林子雨) 第1章 大数据概述 1单选(2分) 第三次信息化浪潮的标志是: A.个人电脑的普及 B.云计算.大数据.物联网技术的普及 C.虚拟现实技术的普及 D.互联网的普及 正确 ...

  9. 大数据技术原理与应用—课后题答案(第一章)

    大数据技术原理与应用_林子雨版_课后题答案(第一章) 1.试述信息技术发展史上的3次信息化浪潮及具体内容. 信息化浪潮 发生时间 标志  解决问题                           ...

最新文章

  1. opencv图像识别
  2. mysql不对称复制数据_mysql UNION all 实现不对称数据统计
  3. 【总结】C# 线程同步技术(一)之 Join 方法
  4. 判断数据表是否存在,不存在则创建
  5. 在git中取消删除已删除的文件
  6. Spring源码之bean的加载(三)从bean中获取对象
  7. python制作gif动图_Python几行代码制作Gif动图
  8. 浪潮服务器怎么获取cpu信息,浪潮获取cpu、内存、硬盘等信息(redfish协议+restfull协议)...
  9. 基于树莓派的遥控开锁装置
  10. 用shell脚本在consul注册exporter服务
  11. Android9设备打开WIFI热点,Android9.0Wifi热点开启流程梳理
  12. 由矩阵运算来看初等矩阵的左乘右乘所影响到矩阵的行列变换的本质
  13. 抗渗等级p6是什么意思_混凝土防水等级S6,P6分别是什么意思
  14. brpc源码解析(四)—— Bthread机制
  15. ESXi/ESX 链路聚合
  16. 从头开始 windows 10 安装awscli,aws sam
  17. Pytest如何查找用例耗时最长的N个
  18. JAVA数据类型的划分
  19. 集体封盘,深度回撤,量化私募的高光时刻已不再?
  20. python怎么去掉视频字幕_python实现去除下载电影和电视剧文件名中的多余字符的方法...

热门文章

  1. UGUI源码解析(二十二)ContentSizeFitter
  2. 基于多层结构的网络游戏平台的研究与应用
  3. Shader玉石效果
  4. Java工具使用(导读)
  5. 用 LCD1602 显示的时钟
  6. Python基于WordCloud词云图的数据可视化分析 词云图的基本使用 政府工作报告分析
  7. 高斯-赛德尔(Gauss-Seidel)解线性方程组的Matlab实现
  8. 「CTS2019」氪金手游
  9. #define STATIS_SObj ((struct statis volatile far *) 0x000000)
  10. 宝塔面板修改默认的放行端口8888为8001并且生效