上一篇文章我们总结了10个大数据面试入门级问题,大家是否有收获,如果还没有看的小伙伴,可以直接跳转《干货|50个大数据面试问题及答案第一篇:10个大数据面试入门级问题》开始学习吧!

本次我们慧都网分析的是10个已经在大数据行业工作的老司机们面试时的问题及建议答案,话不多说,赶紧开始今天的学习。

基于大数据已从业者的面试问题

如果您在大数据世界中有相当丰富的工作经验,那么根据您以前的经验,您将在大数据面试中被问到一些问题。这些问题可能与您的经验或基于场景有关。所以,准备好这些最好的大数据面试问题和答案 。

11.您有大数据经验吗?如果有,请分享一下。

如何处理:  问题没有具体答案,因为这是一个主观问题,答案取决于您以前的经验。在大数据访谈期间询问这个问题,面试官想要了解您以前的经验,并且还试图评估您是否适合项目要求。

那么,你将如何处理这个问题呢?如果您有以前的经验,请在过去的职位上开始履行职责,并慢慢向对话添加详细信息。告诉他们您使项目成功的贡献。一般来说,这个问题是在面试中提出的第二或第三个问题。后面的问题是基于这个问题,所以请仔细回答。您还应该注意不要过度使用以前工作的一个方面。保持简单和重点。

12.您更喜欢好的数据还是好的模型?为什么?

如何处理: 这是一个棘手的问题,但通常在大数据面试中被问到。它要求您在好的数据或好的模型之间进行选择。作为候选人,您应该尝试根据自己的经验回答这个问题。许多公司希望遵循严格的数据评估流程,这意味着他们已经选择了数据模型。在这种情况下,拥有良好的数据可能会改变游戏规则。另一种方式也适用于基于良好数据选择的模型。

正如我们已经提到的,请根据您的经验回答。但是,不要说拥有良好的数据和良好的模型很重要,因为在现实生活中很难同时拥有这两个数据。

13.您是否会优化算法或代码以使其运行更快?

如何处理: 这个问题的答案应该始终是“是”。真实世界的性能很重要,它不依赖于您在项目中使用的数据或模型。

面试官可能也有兴趣知道您是否有任何以前的代码或算法优化经验。对于初学者来说,这显然取决于他过去从事过哪些项目。有经验的候选人也可以相应地分享他们的经验。但是,请诚实地对待您的工作,如果您过去没有优化代码,那就没关系了。只需让面试官了解您的真实体验,您就可以破解大数据访谈。

14.您如何处理数据准备?

如何处理: 数据准备是大数据项目的关键步骤之一。大数据访谈可能涉及至少一个基于数据准备的问题。当面试官问你这个问题时,他想知道你在数据准备过程中采取了哪些步骤或预防措施。

如您所知,需要数据准备才能获得必要的数据,然后可以进一步用于建模目的。你应该把这个消息传达给面试官。您还应该强调要使用的模型类型以及选择特定模型的原因。最后,但并非最不重要,您还应该讨论重要的数据准备术语,如转换变量,异常值,非结构化数据,识别差距等。

15.您如何将非结构化数据转换为结构化数据?

如何处理: 非结构化数据在大数据中非常常见。应将非结构化数据转换为结构化数据,以确保正确的数据分析。您可以通过简要区分两者来开始回答问题。完成后,您现在可以讨论用于将一个表单转换为另一个表单的方法。您也可以分享您所做的真实情况。如果您最近刚毕业,那么您可以分享与您的学术项目相关的信息。

通过正确回答这个问题,您发出信号表明您了解结构化和非结构化数据的类型,并且具有使用这些数据的实践经验。如果你具体回答这个问题,你肯定能够破解大数据访谈。

16.哪种硬件配置对Hadoop作业最有利?

配置4/8 GB RAM和ECC内存的双处理器或核心机器是运行Hadoop操作的理想选择。但是,硬件配置因项目特定的工作流程和流程而异,因此需要进行自定义。

17.当两个用户尝试访问HDFS中的同一文件时会发生什么?

HDFS NameNode支持独占只写。因此,只有第一个用户将收到文件访问权限,第二个用户将被拒绝。

18.如何在NameNode关闭时恢复它?

需要执行以下步骤才能启动并运行Hadoop集群:

  1. 使用文件系统元数据副本的FsImage启动新的NameNode。
  2. 配置DataNode以及客户端以使它们确认新启动的NameNode。
  3. 一旦新的NameNode完成加载从DataNode收到足够块报告的最后一个检查点FsImage,它将开始为客户端提供服务。

在大型Hadoop集群的情况下,NameNode恢复过程会消耗大量时间,这在日常维护的情况下将成为更大的挑战。

19.您对Hadoop中的Rack Awareness有何了解?

它是一种应用于NameNode的算法,用于决定块及其副本的放置方式。根据机架定义,同一机架内的DataNode之间的网络流量最小化。例如,如果我们将复制因子视为3,则将两个副本放在一个机架上,而将第三个副本放在单独的机架中。

20.“HDFS Block”和“Input Split”有什么区别?

HDFS将输入数据物理地划分为用于处理的块,这被称为HDFS块。

输入拆分是映射器用于映射操作的逻辑数据划分。

欢迎咨询慧都在线客服,我们将帮您转接大数据专家团队,并发送相关资料给您!

下集预告:干货|50个大数据面试问题及答案第三篇:10个大数据Hadoop面试问题

干货|50个大数据面试问题及答案第二篇:10个大数据面试中级问题相关推荐

  1. 想提高面试通过率?回答好这10个问题征服面试官

    之前UI黑客发表了一篇叫<面试了50多位UI设计师,我总结了这些求职技巧>的文章,在网上得到很多设计师认可,感谢各位支持. 文章列举了我在面试的时候经常问的三个问题,但是没有进行详细解答. ...

  2. 做为一名大数据新手,应该通过这篇文章了解大数据

    一.大数据是什么? 大数据,big data,<大数据>一书对大数据这么定义,大数据是指不能用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理. 这句话至少传递两种信息: 1.大 ...

  3. 「数据密集型系统搭建」开卷篇|什么是数据密集型系统

      在我们开发的诸多系统,基本都可以视为"数据密集型系统",数据是一切物质的载体,我们依靠数据做存储记录,通过数据进行信息传递交换,最终还要数据来呈现和展示等,从一定视角而言,系统 ...

  4. power bi报表html,Power BI -- 第二篇:Power BI数据可视化之基于Web数据的报表制作(经典级示例)...

    http://www.cnblogs.com/muchen/p/5391101.html 阅读目录 •前言 •Power BI的三大工作区 •导入数据 •数据塑形 - 工作区介绍 •数据塑形 - 工作 ...

  5. mysql 5.7 单节点多实例_mysql5.7 多实例(第二篇)从节点数据异常

    前言: 大年初五,原计划撸一遍数据库监控的知识点,查看数据库时发现某一从节点数据不一致 1.查看节点状态   mysqld_multi report; 图1 2. 启动 所有节点   mysqld_m ...

  6. linux系统读取第二个盘的数据,磁盘及文件系统管理—第二篇

    挂载配置文件 每行定义一个要挂载的文件系统及相关属性 使用mount -a挂载/etc/fstab文件中所定义的文件系统 配置文件格式: 一共分为6个字段: 1.要挂载的设备:指定挂载设备 可指定设备 ...

  7. Java架构师面试之Netty面试专题及答案(共10题,含详细解答)

    [Java架构师面试网]收集整理了几乎整个架构师学习途中会遇到的面试题,希望大家都能早日圆自己的架构师梦~ 公众号:Java架构师面试网,关注回复"资料"即可领取精美整理的面试资料 ...

  8. 初中计算机竞赛面试题目及答案,2019上半年初中信息技术教师资格面试真题及答案(第四批)...

    初中信息技术<在网页中插入表格> 一.考题回顾 题目来源:2019年5月19日贵州贵阳市面试考题 试讲题目 1.题目:在网页中插入表格 2.内容: 一.插入并设置表格 单击表格à插入à表格 ...

  9. 初中计算机竞赛面试题目及答案,2019上半年初中信息技术教师资格面试真题及答案(第二批)...

    初中信息技术<建立统计图表-柱形图.折线图.饼图> 一.考题回顾 题目来源:2019年5月18日吉林长春市面试考题 试讲题目 1.题目:柱形图.折线图.饼图 2.内容: 用电子表格软件处理 ...

最新文章

  1. 185页深度报告 扒一扒AI金融的老底【附下载】
  2. 解读MySQL事务的隔离级别和日志登记模式选择技巧
  3. php 抽象类 继承,PHP 抽象类继承抽象类时的注意点
  4. 基于Android Studio的内存泄漏检测与解决全攻略
  5. springboot官网-application.properties文件
  6. java 技术点_Java的21个技术点和知识点归纳
  7. 如何将低压精密运算放大器的性能扩展到高压高侧电流检测应用(高电流电阻采集电压电路图及误差分析)
  8. 《JavaScript设计模式与开发实践》模式篇(3)—— 代理模式
  9. [C]Ubuntu 13.04实现NVIDIA双显卡切换
  10. How to identify the product settype and attribute in a given list
  11. Outlook Express 错误代码表
  12. 【Hadoop】java.io.IOException: Failed on local exception: java.nio.channels.ClosedByInterruptException
  13. QItemSelectionModel——视图选择
  14. vlan 动态ospf综合网络配置
  15. python语言中print函数的作用_python中print()方法有什么
  16. winform定义数据源名称_C#中数据源绑定DataSource以及相关控件(DataGridView)的使用总结...
  17. Python中如何获取类属性的列表
  18. linux查看及修改文件权限以及相关
  19. Ubuntu 18.04 安装驱动
  20. 怎么更改坐标轴标题access_excel图表如何修改x坐标轴数值,excel怎么设置横坐标标题...

热门文章

  1. 进程调度之8:nanosleep与内核定时器
  2. Incompatible types for sink column报错解决
  3. 华为2017年实习面试面经(研发类)
  4. 【实战原创】Centos7下Samba服务器配置(实战)
  5. Windows_一些小功能
  6. C语言的memcpy和memmove
  7. 表单输入事件辨析-oninput、onkeyup、onchange 开发须知!
  8. 2022.1.18(一测补题,树的遍历题目,并查集)
  9. 用java实现文件夹的复制
  10. el-tooltip disabled属性失效