单选1 .DataWorks可以提升对业务数据的分析能力并进行有效监控,更好地业务赋能。这体现了DataWorks的哪一种能力?
A. 日志大数据分析
B. 精细化运营
C. 数据安全管理
D. 数据收集和存储

A

单选1 2.DataWorks运维中心周期任务运维中,如果将当前节点置为暂停(冻结)状态,以下说法正确的是?
A. 仍会调度当前任务生成的实例
B. 暂停后,正常生成实例
C. 暂停后,不会生成实例
D. 仍会调度下游依赖实例

C

单选
3 DataWorks的数据集成是稳定高效、弹性伸缩的数据同步平台,致力于提供复杂网络环境下、丰富的异构数据源之间高速稳定的数据移动及同步能力。不支持下列哪一种类型的数据同步到MaxCompute?
A. RDS中的数据
B.半结构化
C.结构化数据
D. OSS中存放的非结构化数据

D

单选
4.DataV数据可视化是使用可视化应用的方式来分析并展示庞杂数据的产品,以下哪个应用场景不是使用DataV可以实现的?
A.开发天猫双11.阿里云城市大脑同款数据可视化应用
B. 开发工业级的数据可视化项目
C.搭建专业级地理信息可视化应用
D. 搭建企业级数据分析平台

D

单选5 .DataWorks中提供了简单模式和标准模式两种工作空间模式。关于两种模式,以下描述哪个是错误的?
A.简单模式是指一个Dataworks工作空间对应一个MaxCompute项目
B. 标准模式是指一个Dataworks工作空间对应两个MaxCompute项目
C. 简单模式可以升级为标准模式;标准模式也可降级为简单模式
D.标准模式下,开发环境默认不开启任务调度,避免开发环境的任务周期运行时,和生产环境的务抢夺资源

C

单选6 .DataWorks数据集成主要用于离线(批量)数据同步。下列关于离线同步说法正确的是?
A. 只能实现结构化数据源的传输
B.只支持关系型数据库MySQL,RDS等
C. 数据集成不仅完成数据同步(传输), 还提供数据流的消费方式
D. 离线数据同步主要由三部分组成: Reader, Channel, Writer

D

单选
7 .DataWorks中,运维中心的“任务管理视图”以( )的方式显示调度任务之间的依赖关系和运行约束。
A.平衡树
B. DAG图
C.双向列表
D.二叉树

B

单选I 8.DataWorks业务流程能够根据业务种类组织不同类型的节点,以业务为单元开发代码。关于DataWorks业务流程的节点说法错误的是?
A.可通过拖拽管理节点
B. 不包括虚拟节点
C. 包括跨租户节点
D. 包括数据同步节点

B

单选9.大数据4V特征之-是"Value" ,表明大数据本身具有价值,其提供的核心价值是()。
A. 洞察与预测
B.存储与计算
C. 资源优化配置
D. 传统企业转型

A

单选I 10.Quick BI是阿里云提供的数据可视化服务,以下哪个不是Quick BI在大数据方案中可以承担的角色?
A.离线数仓
B. 数据展示
C. 即席查询
D.报表分析

A

单选1 11.DataV支持多种数据源的接入,以下哪个数据源是DataV不支持的?
A.云原生数据仓库(分析型数据库) AnalyticDB
B. 云数据库RDS MySQL版
C.本地视频
D. 本地CSV

C

单选1 12监督学习利用-组已知类别的样本来训练模型,这些输入的数据又被称为什么?
A.测试数据
B.训练数据
C.验证数据
D.结果数据

B
13某超市通过分析顾客的购买记录后发现,购买纸尿裤的人有较大的概率也会购买啤酒,这个案例使用了大数据分析的( )技术。
A.分类
B.聚类
C.关联分析
D.时序分析

C
14.分类属于有监督学习算法,以下哪个不属于分类算法应用的场景?
A. 分析用户是否会购买电脑
B. 分析用户是否会点击弹出的广告
C. 分析收到的邮件是否是垃圾邮件
D. 根据新输入父亲的身高来分析其孩子的身高

D

单选15 按照学习方式不同进行分类,以下哪个不属于机器学习的分类?
A.监督学习
B. 无监督尖习
C. 半监督学习
D. 全监督学习

D

单选I 16.回归属于有监督学习算法,以下哪个不属于回归算法应用的场景?
A. 根据新输入父亲的身高来分析其孩子的身高
B. 分析用户是否会购买电脑
C. 根据现有房价信息,预测未来的房价
D. 根据历史的天数据,预测未来的天气

B
17.阿里云Quick BI报表工具支持多种数据源,方便用户基于自己来自不同数据源的数据进行分析和展现。目前还不支持( )作为数据源。
A. API调用返回结果
B. MaxCompute
C. 本地Excel文件
D. MySQL版RDS

A
18.组织管理是Quick BI提供的功能,为用户提供了数据协同开发的能力。以下关于组织管理的描述错误的是?
A. 组织成员管理工作就是负责把需要在该组织中进行协同工作的阿里云用户加到组织中
B.在组织层面,只有两种组织角色:组织管理员和普通用户
C.组织创建者默认就是组织管理员
D.普通用户可以访问组织成员管理功能模块

B

19.DataV通过发布的功能可以分享开发好的数据大屏,以下关于发布功能描述正确的是?
A. 发布出去的数据大屏链接只有阿里云的用户才能够访问,无需开通DataV服务
B. 发布出去的数据大屏链接只有开通DataV服务的阿里云用户才能够访问
C. 只要获取了发布出去的数据大屏链接,就可以访问到大屏的内容
D. 数据大屏分享出去后,无法对访问用户进行安全验证

C

单选1 20.DataWorks是阿里云重要的PaaS平台产品,为您提供数据集成、数据开发、数据地图、数据质量和数据服务等全方位的产品服务,以下属于DataWorks使用场景的是?
A.存储海量的数据,进行数据的清洗
B. 使用DataWorks,对数据进行传输、转换和集成等操作,从不同的数据存储引入数据,并进行转化和开发
C. 对数据进行离线计算
D. 直接把计算的结果显示出来

B

单选21 .DataWorks调度配置中可以设置重跑"和“出错自动重跑”,当“重跑”属性设置为以下哪种时,“出错自动重跑”属性不会显示出来?
A.运行成功或失败后皆可重跑
B. 运行成功后不可重跑
C. 运行失败后可以重跑
D. 运行成功或失败后皆不可重跑

D

单选22 .使用MaxCompute SQL更新数据时,以下说法中不正确的是( )。
A. 使用动态分区插入数据时,需在语句中指定分区值,且只要出现在select子句中最后一 个位置即可,也可为该值指定一一个易于识别的别名
B. 进行insert更新数据操作时,源表与目标表的对应关系依赖于在select子句中列的顺序,而不是表与表之间列名的对应关系
C. 向某个具体的分区插入数据时,分区列不允许出现在select列表中
D. 支持在一个语句中实现读取一次写入多个目标表的操作

D

单选1 23.MaxCompute是阿里自研的一种快速、完全托管的EB级数据仓库解决方案,以下哪个是MaxCompute的基本计算单元,并且SQL和MR都是通过其来执行的?
A.实例
B.任务
C.表格
D.资源

B

单选
24.MaxCompute架构由四层组成,每一层完成不同的工作。现在执行命令"desc table",最终由( )处理该命令并返回结果。
A.逻辑层
B.客户端
C.接入层
D.计算层

D

单选I 25 .MaxCompute提供了多种针对日期的计算函数,以下函数中,能实现计算两个时间的差的是( )。
A. datediff
B. timestampdiff
C. interval
D.直接相减

A

单选26 .MaxCompute表支持生命周期管理,即表中的数据从最后一次更新时间算起,在经过指定的时间后没有变动,则此表将被MaxCompute自动回收。以下说法中正确的是( )。
A. 对于某非分区表,- -旦其ifecycle值指定的时间段内未更新,则该表将被自动删除
B. 建表时可以指定ifecycle,其单位为小时,其取值必须为正整数
C. 可以给不同的表或者不同的分区指定不同的生命周期lifecycle值
D. 对于某分区表,一旦其lifecycle 值指定的时间段内未有任何分区数据发生过更新,则该表将被自动删除

A

单选27 ,关于MaxCompute SQL中分区的说法,以下错误的是哪一项?
A. 使用MaxCompute SQL添加分区时,一次只能添加一个分区
B. 使用MaxCompute SQL删除分区时,一次可以删除多个分区
C. 对于多级分区的表,如果需要添加新的分区,必须指明全部的分区值。
D. 添加分区时,如果未指定IF NOT EXI:TS而同名的分区已存在,则返回报错。

A

单选28 .大数据,指的是所涉及的数据量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策的资讯。以下哪一一个不属于大数据的4V特征?
A. Volume数据体量大
B. Velocity数据变化快
C. Value价值密度高
D. Variety数据类型多

C

单选29 .大数据存储-般采用的是分布式存储技术,以下关于分布式存储说法正确的是?
A. Hadoop的分布式存储技术是GFS
B. 分布式存储要求底层有多台高性能存储服务器
C.分布式存储实现数据冗余,提高了数据的安全性
D. 分布式存储方式无法存储传统的结构化数据

C

单选30. ()技术和大数据密切相关,通常把两者比作硬币的两面。
A.云计算
B.网格计算
C. 内存计算
D. 井行计算

A

单选
31.使用DataWorks进行数据开发时,可以创建不同的任务。如果某任务内需要多节点配合并包含表示依赖
关系的连线,则该任务的类型是( )。
A.节点任务
B.工作流任务
C. 多节点任务
D.多工作流任务

B

单选1 32.MaxCompute中有两种快捷建表方法,一种是使用AS, -种是使用LIKE,即create table
new_ table_ name as/ike ...关于这两种方式的说法中正确的是( )。
A. 使用as能根据其后的SQL带入数据到新建的表中,使用like只能建空表
B. 使用as能保留源表的分区属性,但是无法保留ifecycle属性
C. 使用like能保留源表的所有属性,包括ifeccycle. 注释、分区等
D. 使用lke可以依赖于多张源表,使用as只能依赖于一张表

A
33.MaxCompute支持后付费的模式,即用户可以先使用,然后根据使用的资源状况后付费。计费项中不包括因为( )而产生的费用。
A.数据上传
B.数据下载
C.计算
D.存储

A

单选34 .MaxCompute的连接使用方式有多种,其中可以配置依赖、调度的方式是()。
A.使用DataWorks
B. 使用Intelij IDEA
C. 使用MaxCompute Console
D.目前暂无工具支持

A

35可以通过修改文件odps_ config. ini来配置MaxCompute的客户端工具odpscmd,() 是不能使用默认值必须要修改的。
A. project name
B. log view. host
C. https_ check
D. access _id

D

多选I 36.MaxCompute中,用户可以使用tunnel命令行上传或者下载数据。关于tunnel命令的说法中正确的有(
A. 分隔符不支持转义字符
B. 每次只能上传到某一非分区表或者分区表的某-个分区中去
C. 上传文件到分区表的某个分区中去时,tunnel upload不能自动创建不存在的分区
D. 一个download命令可以同时下载多个分区的数据

AB

多选37数据分析是基于商业目的,有目的的进行收集、整理、加工和分析数据,提炼有价值信息的过程,以下哪些属于数据分析的流程?
A. 数据备份
B. 数据收集
C.数据处理
D.数据加密
E. 数据展现

BCE

多选| 38 :资源(Resource)是MaxCompute的特有概念,MaxCompute支持 上传的单个资源大小上限为500MB,以下哪些资源类型是MaxCompute支持的?
A.File
B. HTML
C. Table
D. Json
E. Jar

ACE

I 多选39,为了使用MaxCompute计算的结果数据作为机器学习的输入数据进行训练,需要使用哪些产品来实现?
A. DataV可视化服务
B.数据工场DataWorks
C. Qulck BI数据可视化分析平台
D. 机器学习平台PAI
BD

多选
40 .阿里云机器学习PAI支持多种常见的算法,以下算法中属于分类算法的有()。
 A. KNN
B. RandomForest
C. K-Means
D. DBSCAN

AB

多选41.MaxCompute支持多种建表语句, 方便用户根据实际情况选择合适的建表方式。表table_ a已经存在且table_ _b不存在的前提下,以下SQL中( )可以完成表table_ b的创建。
A. create table table_ b(id bigint.name string);
B. create table table_ b as select * from table_ a;
C. create table table_ b like table a;
D. replicate table_ a to table_ b;
E. create table table. b like select * from table. a;

ABC

多选42.Tunnel是MaxCompute提供的数据传输服务,提供高并发的离线数据上传下载服务,以下关于Tunnel的说法正确的是?
A. 支持每天TB/PB级别的数据导入导出
B.特别适用于增量数据的导入
C. 特别适合于全量数据或历史数据的批量导入
D. Tunne|功能及Tunnel SDK支持外部表操作

AC

多选43 .在MaxCompute SQL中可以通过create table语句创建一个新表, 创建表时可以指定if not exists,以下说法正确的有( )。
A.如果在创建表时指定if not exists,如果存在同名的表,则不会更改现有表,直接返回成功
B.如果在创建表时指定if not exists,并且存在表结构不一致的同名表,此同名表会改动表结构
C. 如果在创建表时不指定if not exists,并且存在同名表,报错返回
D. 如果在创建表时不指定f not exists,无论是否存在同名表,均返回成功

AC

多选1 44.DataWorks项目空间的管理员角色拥有项目空间的各种管理权限,以下操作中( )必须由拥有项目管理员角色的成员来完成。
A. 创建DataWorks项目空间L
B. 把组织成员添加为项目成员并分配合理的角色
C. 添加调度资源组
D. 添加数据源

AB

多选I 45.DataWorks中可以配置任务调度的时间粒度,目前支持( )等时间粒度的调度。
A. 1分钟
B.1天
C.1月
D. 1小时

ABCD

多选46某运维人员在DataWorks中新创建了周期调度工作流,并在昨天就发布成功了,今天在运维中心中查看时,尚未有调度信息,可能存在的问题有( )。
A. 配置调度属性时,未选择“启动调度"
B. 今天的日期不在设置的"生效时间范围内
C. 新创建的工作流是在昨天晚上22: 30分前发布
D. 未到为该任务设置的调度时间

ABD

多选1 47.DataWorks中,如果当前工作流节点任务存在上游任务,则调度执行时,必须满足( )等条件才可以调度执行。
A. 上游任务已经执行
B. 上游任务已经执行并返回成功
C. 自身定制时间已到或已过
D. 自身定制时间未到

BC

多选I 48.创建数据集是Quick BI前端可视化数据分析的基础,用户可以通过哪些方式创建数据集?
A.通过上传本地文件创建数据集
B. 通过数据源表创建数据集
C. 通过即席分析SQL创建数据集
D.通过已有数据集创建新的数据集

BC

I 多选49 .DataWorks中, 调度任务每次运行前都先将任务实例化,即生成对应的实例,调度运行时实际上在执行相应的实例。在调度的不同阶段,实例会处于不同的状态,包括( )。
A.末运行
B.运行中
C. 运行成功
D.暂停

ABCD

多选
50.DataV按照使用场景主要可以分为三类,分别是展示类大屏、分析类大屏和监控类大屏。以下关于分析类大屏的描述正确的是?
A. 为运维人员提供监控信息
B.展示数据关联及分析结果
C. 多用于讨论决策
D. 偏重于展示业务信息结构以及业务亮点

ABCD

ACA大数据助理工程师题库总结相关推荐

  1. 全网最齐全的《大数据选择题题库.pdf》限时开放下载!

    文末获取资料 最近有些同学在笔试的时候会遇到一些关于大数据知识的选择题,网上很少几乎没有这方面的资料,于是我自己搞了份135页的大数据选择题题库,里面不止涵盖大数据的知识,也有Java.Linux以及 ...

  2. 阿里云ACA大数据助理工程师认证学习笔记和题

    1 某大型企业计划使用MaxCompute对本公司的数据进行加工和分析,预计该项目会有上万个表.数干个本题分信任务,同时有近4人的团队负责该项目的建设和运维.从工程角度出发, ()可以大大减少项目管理 ...

  3. 大数据分析师题库整理(Part Two)

    Day 06 241.Fusioninsight HD 中Hbase 默认使用什么组件作为其底层文件存储系统? HDFS 242.在很多小文件场景下,Spark 会起很多Task,当SQL逻辑中存在S ...

  4. 算法笔记(三)特殊数据结构——哈希表、有序表、并查集、KMP、Manacher、单调栈、位图、大数据类题

    layout: post title: 算法笔记(三)特殊数据结构--哈希表.有序表.并查集.KMP.Manacher.单调栈.位图.大数据类题 description: 算法笔记(三)特殊数据结构- ...

  5. python数据分析基础试题及答案_Python数据分析与数据可视化题库免费期末考试2020答案...

    Python数据分析与数据可视化题库免费期末考试2020答案 更多相关问题 风险管理是一个不断发展变化的演变过程.在风险管理演变过程中,大多数现代风险管理形式是从()中 以下哪项是虚证闭经的主要病机A ...

  6. 600套axure可视化大数据原型元件库模板40G[收藏]

    在做产品经验的朋友,必备的就是自己手上有很多axure RP原型素材库,特别在做可视大数据原型交互,这时有40G大屏可视化大数据设计ps素材axure模板原型元件库界面ps 70+600套. Axur ...

  7. 牛客网数据开发题库_练习SQL利器,牛客网SQL实战题库

    牛客网SQL实战网址:https://www.nowcoder.com/ta/sql 持续更新--记录自己在牛客网SQL的做题过程 更新进度:61题,2019-4-3,更完了 1.查找最晚入职员工的所 ...

  8. 云计算与大数据期末考试题库

    单选题 1. 以下哪一项不属于Hadoop可以运行的模式___C___. A. 单机(本地)模式 B. 伪分布式模式 C. 互联模式 D. 分布式模式 2.Hadoop作者 Martin Fowler ...

  9. 云计算与大数据概论题库

    大数据分析 作业00 1.人们通常最熟悉结构化数据的分析.除了半结构化."准"结构化和非结构化这三种基本数据类型以外,还有一种重要的数据类型为元数据,它主要由( ),能够添加到数据 ...

最新文章

  1. cpld xilinx 定义全局时钟_AutoSAR中的时钟同步机制
  2. 内核电源管理器已启动关机转换_Linux系统启动流程
  3. 液相色谱柱PHP,C18液相色谱柱 - 食品仪器分析 - 食品论坛 - Powered by Discuz!
  4. paper 22:kl-divergence(KL散度)实现代码
  5. 服务器磁盘空间占用,大文件查找
  6. 使用Instruments中的CoreAnimation分析动画
  7. Could not find or load main class org.apache.hadoop.hdfs.server.namenode.NameNode
  8. 【BZOJ】1052: [HAOI2007]覆盖问题(贪心)
  9. 文件同步备份工具—Second Copy
  10. Elasticsearch检索分类深入详解—基础篇
  11. Revit SDK 介绍:CompoundStructure 复合结构
  12. 数据分析|基础概念/excel/tableau自学笔记
  13. imgui中在指定位置(非固定window方式)绘制text
  14. 朴素版Dijkstra算法
  15. 单片机(STC12C5A60S2)内部PWM实现呼吸灯
  16. 腾格里沙漠部分污染地被填埋 记者采访被限自由
  17. mysql的锁机制(读锁,写锁,表锁,行锁,悲观锁,乐观锁,间隙锁)
  18. 2022-2028全球一次性防护服行业调研及趋势分析报告
  19. 微信小程序实现滑块验证码
  20. u盘不小心格式化了怎么办?用u盘数据恢复软件

热门文章

  1. 实战:电表网络中接线
  2. 在PyQT5上可视化车道线检测
  3. 公司到底是怎么看我们的……
  4. toad for oracle12.11,Toad for Oracle
  5. java中方法的基本使用
  6. 空白符号筛选测试真正能用的空白格符号直接复制即可
  7. matlab工程数学实践,matlab高等工程数学作业实践报告
  8. Java反编译利器JD-GUI
  9. 学好编程之GOC语言快速入门(1)
  10. VC6插件开发应用实例