【数据分析面试】字节跳动数据分析面试题(附答案解析)
更多优质干货内容可以look共粽号:【数据分析星球】,get海量数据分析资料!
01写在前面
数据分析SQL面试笔试题系列第6篇来啦!
数据分析面试会重点考查候选人两方面的能力,一个是基础的数据工具能力,最常考的就是SQL,这部分前面我们已经有4篇连载文章全面剖析了大厂的常考笔试题型,没看的同学不要错过了,可以戳:
考查的另一方面就是业务思维能力了,这一块主要是设定一些常见的业务场景,需要你给出对应的分析思路和方法,这一块对于没有数据分析经验的小伙伴们来说就很不友好了,很多面试的朋友碰到这类题都会很慌,无从下手,因为没做过,也不知道怎么分析啊!!!
不过不用怕,我收集了近几年一些大厂的面试笔试题,有笔试题也有业务题,通过这些题目的详细讲解,你应该就能掌握这类题目的解答思路了,话不多说,今天我们先来扒一扒字节跳动的面试题目吧!
一共有3道题目如下:
SQL笔试题:计算视频好评率
业务题1:使用ABTest对新算法效果进行评估
业务题2:如何评估一场活动的效果?
02 计算西瓜视频内容好评率
1)需求
西瓜视频近期开展了”2020百大人气创作者”优质内容扶持项目,鼓励用户产出优质的视频内容。现需要统计2020年11月01日至2020年11月30日期间创作的视频中,“科技”大类下“数码测评"子类的视频好评率(好评率=好评数/视频观看次数),写出sql语句进行查询。
用户观看视频后的评价详情表:content_action_info
id(视频id,主键)
create_time (创建时间,格式‘2020-11-01’)
user_id(观看者id)
content_id (视频id,外键)
content_action (视频评价,包括’点赞‘,’差评‘,‘无评价’)
视频详情表:dim_content
content_id (外键)
creator_id(创作者id)
content_category (商品类目)
content_sub_category (品牌名称)
2)解题思路
题目很简单,我们只需要明确好评率的计算公式,然后先定特定的大类和子类即可。
1.好评率=好评数/视频观看次数。
2.要求计算“科技”大类下“数码测评"子类的视频好评率,则要使用where条件筛选指定大类和子类的数据。
3.因为限定条件要指定视频内容的类别,所以要两个表做关联。
代码如下:
select
count(1) as all_action
sum(case when content_action=‘点赞’ then 1 else 0 end) as like_action
sum(case when content_action=‘点赞’ then 1 else 0 end)/count(1) as like_rate
from content_action_info as a
join dim_content as b
on a.content_id=b.content_id
where b.content_category=‘科技’
and b.content_sub_category=‘数码测评’
and a.create_time between ‘2020-11-01’ and ‘2020-11-30’;
03 使用AB Test评估算法效果
1)需求
某个购物APP最近优化了“猜你喜欢”模块的推荐算法,希望进一步提升推荐的精准度,进而提升销售额。现在需要通过AB Test(50%用户保留原先推荐算法的为控制组,50%用户使用新的推荐算法为实验组)来对新的推荐效果进行评估。假设你是此次实验的数据分析师,请问你会如何评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。
2)解题思路
指标:推荐商品的销售额、推荐商品点击率、推荐商品的转化率
分析过程:
1.设原假设为使用新的推荐算法后上述指标降低或不变,备择假设为使用新的推荐算法后上述指标增加。
2.选择显著性水平临界值为5%,并根据指标的预期提升确定样本量和试验周期。
3.样本合理分流,AB测试上线,采集数据。
4.使用T检验,计算P值,进行效果验证。
5.分析结论,如果P值小于5%,那么原假设不成立,备择假设成立,即使用新算法后指标提升。
反之无法推翻原假设,不能证明使用新算法后指标提升.
针对AB Test的拓展阅读,包括如何确定试验样本量和分流,可以翻看公众号历史文章:【长文干货】AB测试:原理流程、实际案例及面试指南。
04 如何评估一场活动的效果
1)需求
某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,作为数据分析师,你如何评估这场活动的效果?
2)解题思路
如果要对一个活动效果进行分析,无非是要回答以下3个问题:
1、活动效果怎么样?要不要继续做?
2、如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?
3、针对问题环节的改进方案是什么?
具体展开来讲,可以从以下几个方面
1、活动关键指标达成分析
活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?
2、活动关键流程漏斗分析
活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。
3、活动的渠道、用户分析
活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?
4、活动策略、节奏分析
活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。
以上就是数分面试宝典系列—SQL高频笔试题第6篇文章的内容,部分历史文章请回翻公众号,更多数据分析面试笔试的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享、点赞和收藏哈~
【数据分析面试】字节跳动数据分析面试题(附答案解析)相关推荐
- 2020字节跳动数据库面试题及答案(二)—— NoSQL部分
本文答案整理为原创,转载请说明出处 文章目录 redis 的底层数据结构有哪些 redis 中的 SDS 和 C 语言中的字符串有什么区别,优点是什么 redis 中的字典是如何实现的,如何解决冲突和 ...
- java高并发面试题目_列举Java高并发面试题附答案解析
Java高并发面试题是程序员面试过程中的必修课,只有熟练掌握这些技术要点,在我们的学习中才会脱颖而出,在这里,达内石家庄Java培训老师作深入解答. Java并发面试题附答案 1. 什么是原子操作?在 ...
- 列举Java高并发面试题附答案解析
Java高并发面试题是程序员面试过程中的必修课,只有熟练掌握这些技术要点,在我们的学习中才会脱颖而出,在这里,达内石家庄Java培训老师作深入解答. Java并发面试题附答案 1. 什么是原子操作在J ...
- 【Java面试宝典】1000+面试题附答案详解,最全面详细
进大厂是大部分程序员的梦想,而进大厂的门槛也是比较高的,所以这里整理了一份阿里.美团.滴滴.头条等大厂面试大全,其中概括的知识点有:Java.MyBatis.ZooKeeper.Dubbo.Elast ...
- MySQL面试题 | 附答案解析(十七)
接上篇!!! 9. 主键使用自增ID还是UUID? 推荐使用自增ID,不要使用UUID. 因为在InnoDB存储引擎中,主键索引是作为聚簇索引存在的,也就是说,主键索引的B+树叶子节点上存储了主键索引 ...
- MySQL面试题 | 附答案解析(十四)
接上篇!!! 5. 什么是子查询 (1)QL语句的查询结果做为另一条查询语句的条件或查询结果 (2)SQL语句嵌套使用,内部的SQL查询语句称为子查询. 6. 子查询的三种情况 (1)询是单行单列的情 ...
- MySQL面试题 | 附答案解析(二十)
接上篇!!! 5. MySQL的复制原理以及流程 主从复制:将主数据库中的DDL和DML操作通过二进制日志(BINLOG)传输到从数据库上,然后将这些日志重新执行(重做):从而使得从数据库的数据与主数 ...
- MySQL面试题 | 附答案解析(十九)
数据库优化 1. 为什么要优化 (1)系统的吞吐量瓶颈往往出现在数据库的访问速度上 (2)随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢 (3)数据是存放在磁盘上的,读写速度无法和 ...
- MySQL面试题 | 附答案解析(十八)
接上篇!!! SQL语句优化的一些方法 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 n ...
- MySQL面试题 | 附答案解析(十六)
接上篇!!! 2. SQL的生命周期? (1)应用服务器与数据库服务器建立一个连接 (2)数据库进程拿到请求sql (3)解析并生成执行计划,执行 (4)读取数据到内存并进行逻辑处理 (5)通过步骤一 ...
最新文章
- numpy学习:安装anaconda及使用
- aliyun maven 添加jar_gradle添加阿里云maven库
- JAVA Socket 底层是怎样基于TCP/IP 实现的???
- 牛客多校8 - Interesting Computer Game(并查集)
- BTrace简介及使用
- python函数参数那些事,关键字参数与位置参数
- python汉字长度_行中字符串的长度(Python)
- 95-190-640-源码-窗口操作符-WindowOperator
- SQL 引擎如何把语句转换为一个抽象语法树?
- java毕业设计基于javaweb+mysql数据库实现的大学生助学贷款管理系统(源码+论文+开题报告
- 《现代通信原理学习》(二)随机信号分析
- 关于 Could not find artifact ...:pom:1.0-SNAPSHOT 的问题!
- java中Graphics类的使用
- SQL server 认证考试
- 第一次搭建ftp遇见的蹩脚的问题
- java任务监控进度控制
- Spark 和hadoop的一些面试题(准备)
- MobaXterm Xwindows打开应用程序模糊、缩放比例不对
- IPSEC VPN动态配置(示例)
- Quantopian Risk Model (QRM)
热门文章
- 全国行政区划代码表-201907更新,三级数据
- 利用html编码进行xss攻击
- abb机器人过载报错_ABB机器人50295/50296 故障终极解决方法
- 【数学建模】2022小美赛C题 人类活动分类(Classify Human Activities)
- input获取焦点和失去焦点
- wpf使某个控件失去焦点_WPF 在TextBox失去焦点时检测数据,出错重新获得焦点解决办法...
- iOS 苹果开发者账号--个人账号,公司账号和企业账号的区别
- 邮件服务器4---postfix的主配置文件
- 键盘无法使用,管理器显示hid keyboard device 有问题的解决方法
- Node+OBS直播服务器搭建总结