今年冬天冷的好慢,现在空气中吹的风还是暖的...

京东大数据面试题

_

hive中都有哪些join操作?

  • left join:以左侧为主表,返回记录与主表记录数相同,关联不上的字段为空。

  • right join:以右侧表为主表,返回记录与主表记录数相同,关联不上的字段为空。

  • full join:以两个表的记录为基准,返回两个表的记录去重之和,关联不上的字段为null。

  • cross join:返回两个表的笛卡尔积结果,不需要指定关联键。

  • map join map端连接,与普通连接的区别是这个连接中不会有reduce阶段存在,连接在map端完成。

  • common join:普通连接,在sql中不特殊指定连接方式使用的都是这种普通连接。

  • skew join:倾斜连接,主要针对数据倾斜的情况优化。

  • bucket map join:分桶连接。

_

数仓分层,主要负责哪些任务?

_

有没有遇到过数据倾斜,怎么处理数据倾斜的?

_

HashMap和HashTable区别?

_

sql题:某网站每天有很多人登陆,请你统计一下该应用每个用户最近登陆是哪一天,用的什么设备,

一个登陆(user_login)表:

id,user_id,client_id,date
1    1    1    2022-01-01
2    2    2    2022-02-01
3    1    2    2022-01-03

一个用户表(user)

id,user
1    xiaohong

一个客户端表(client)

id,name
1    pc
2    ios

最终输出字段:

用户名    日期    设备名

 微信公众号:OnlyCoding

_

统计新登录用户的次日留存

一个登陆(user_login)表:

id,user_id,client_id,date
1    1    1    2022-01-01
2    2    2    2022-02-01
3    1    2    2022-01-03

_

算法:给定一颗二叉树,按照从顶部到底部的顺序,返回从右侧能看到的节点值?

输入:[1,2,3,null,5,null,4]

输出:[1,3,4]

_

hive分区和分桶区别?

_

hive分桶表的作用?

_

两个表join过程中,空值的情况如何处理?

_

hive存储结构的区别?

_

hive本身对于sql做了哪些优化?

_

flink retrict/append

_

sql题:

用户表(pin,name,address)
订单表(orderid,pin,orderdate)
订单明细表(orderid,sku,price.quantity,discount)

要求:

  • 统计去年一年内用户消费超过10000的。

  • 对用户进行分级,

    10000<x<11000,属于s级

    10000<x<12000,属于m级

    12000<x<13000,属于a级

  • 连续多次下单,查出第一笔订单和最后一笔订单时间差小于等于3天的用户。

_

_

【面试题】京东大数据面试真题汇总,收藏必备相关推荐

  1. 查看某个分区之前所有的数据_腾讯大数据面试真题汇总

    腾讯面试题 学长1 1)笔试部分 (1)有一表名t_sh_mtt_netdisk_log,从表名可以看出该表是什么业务的,是什么周期粒度的表. (2)怎么查看表结构,表创建语句?怎么查看表有哪些分区? ...

  2. 面试系列一:精选大数据面试真题10道(混合型)-附答案详细解析

    本公众号(五分钟学大数据)将推出大数据面试系列文章-五分钟小面试,此系列文章将会深入研究各大厂笔面试真题,并根据笔面试题扩展相关的知识点,助力大家都能够成功入职大厂! 大数据笔面试系列文章分为两种类型 ...

  3. 精选大数据面试真题10道(附答案详细解析)

    大数据笔面试系列文章分为两种类型:混合型(即一篇文章中会有多个框架的知识点-融会贯通):专项型(一篇文章针对某个框架进行深入解析-专项演练). 此篇文章为系列文章的第一篇(混合型) 第一题:大数据笔试 ...

  4. 185 道必须掌握的大数据面试真题(附答案)

    当今时代,跳槽确实是大部分人升职加薪最快的方式,特别是职业生涯初期.说起来也是很无奈,公司经常是宁愿花更多的钱来请个新人也不愿意加薪留住老人. 面试了 N 多公司之后,我发现其实问来问去也就那几个知识 ...

  5. sql怎么实现取当前数据以及累计7天数据_年薪60万+大佬吐血整理字节跳动大数据面试真题...

    字节的面试难度一直很高,所以一直是我想攻克的目标,定下这个目标后就去准备收集了几十个字节实际面经,还包括面试前都需要做哪些准备.只能说是工欲善其事必先利其器,经过这些周全的准备,最终的面试还是很顺利的 ...

  6. oracle批量update数据_东方国信大数据面试真题

    东方国信 学长1 Hadoop工程师笔试题(金融事业部) 1)技术基础题(共十题,每题5分) (1)列举在Linux系统下可以在看系统各项性能的工具(区分CPU.内存.硬盘.网络等) (2)HDFS写 ...

  7. 2023大数据面试真题(持续更新)

    一.Hadoop 1.hdfs写流程 2.hdfs读流程 3.hdfs的体系结构 4.一个datanode 宕机,怎么一个流程恢复 5.hadoop 的 namenode 宕机,怎么解决 6.name ...

  8. 运维经典面试真题汇总系列

    运维经典面试真题汇总系列 如何判断 mysql 主从是否同步?该如何使其同步?** Slave_IO_Running Slave_SQL_Running: 略 2. mysql 的 innodb 如何 ...

  9. 2022京东最新Android面试真题解析,腾讯T3亲自教你

    前言 为什么今天突然说到学习路线,学习资料.因为最近在看知乎的时候,我看到一个大家都比较在意的一个问题,就是大家对工资和自己具备的能力是否成正比报有疑虑,所以今天这篇文章不仅仅是给大家解答这个疑虑,更 ...

最新文章

  1. ubuntu18.04配置wifi 方法
  2. 重温经典之排序 java实现
  3. migo获取header sap_Adjust Stock(MI06, MI07, MIGO)
  4. WSDM 2022 | 一种用于在线广告自动竞价的协作竞争多智能体框架
  5. 计算机视觉python入门_计算机视觉应该怎样入门?
  6. LeetCode-----斐波那契数列
  7. Sharepoint 自定义搜索
  8. CF 917A The Monster 【括号匹配】
  9. 关于erlang的-run 的启动参数
  10. psasp和matlab,MATLAB和PSASP电力系统潮流计算比较研究
  11. 一个简单的java程序
  12. 使用FME实现电子地图应用之地址解析
  13. rtklib-eph2pos-利用广播星历计算卫星的PVC-详细解说
  14. DBeaver打开sql文件中文乱码问题解决
  15. noip模拟测试 主仆见证了 Hobo 的离别
  16. CentOS 6.8 Local time zone must be set--see zic manual page
  17. 这个日本大叔变态地扔了98%的家当后,瞬间从屌丝逆袭成人生赢家!
  18. layui表格下拉框无法显示
  19. 【API】开源免费接口管理
  20. 程序员的浪漫情诗,您学会了吗?

热门文章

  1. 基于html5的音乐网站开题,开题报告基于HTML5的音乐网站.doc
  2. SVN-服务器及pc端SVN搭建
  3. 佳能MP4视频恢复方法
  4. 21届实习腾讯面试的经验贴(已凉)
  5. 小程序拼团商城系统开发
  6. 薅羊毛拼团商城2.5.3小程序源码
  7. 【网站】数字滚动效果的实现方法
  8. 添加fiddler证书到手机根目录
  9. java网络编程实用精解_Java网络编程实用精解
  10. 云黑系统,浪客云黑3.0,黑名单系统