更多优质干货内容可以look共粽号:【数据分析星球】,get海量数据分析资料!

01写在前面

数据分析SQL面试笔试题系列第6篇来啦!

数据分析面试会重点考查候选人两方面的能力,一个是基础的数据工具能力,最常考的就是SQL,这部分前面我们已经有4篇连载文章全面剖析了大厂的常考笔试题型,没看的同学不要错过了,可以戳:

考查的另一方面就是业务思维能力了,这一块主要是设定一些常见的业务场景,需要你给出对应的分析思路和方法,这一块对于没有数据分析经验的小伙伴们来说就很不友好了,很多面试的朋友碰到这类题都会很慌,无从下手,因为没做过,也不知道怎么分析啊!!!

不过不用怕,我收集了近几年一些大厂的面试笔试题,有笔试题也有业务题,通过这些题目的详细讲解,你应该就能掌握这类题目的解答思路了,话不多说,今天我们先来扒一扒字节跳动的面试题目吧!

一共有3道题目如下:

SQL笔试题:计算视频好评率

业务题1:使用ABTest对新算法效果进行评估

业务题2:如何评估一场活动的效果?

02 计算西瓜视频内容好评率

1)需求
西瓜视频近期开展了”2020百大人气创作者”优质内容扶持项目,鼓励用户产出优质的视频内容。现需要统计2020年11月01日至2020年11月30日期间创作的视频中,“科技”大类下“数码测评"子类的视频好评率(好评率=好评数/视频观看次数),写出sql语句进行查询。

用户观看视频后的评价详情表:content_action_info

id(视频id,主键)
create_time (创建时间,格式‘2020-11-01’)
user_id(观看者id)
content_id (视频id,外键)
content_action (视频评价,包括’点赞‘,’差评‘,‘无评价’)

视频详情表:dim_content

content_id (外键)
creator_id(创作者id)
content_category (商品类目)
content_sub_category (品牌名称)

2)解题思路

题目很简单,我们只需要明确好评率的计算公式,然后先定特定的大类和子类即可。

1.好评率=好评数/视频观看次数。

2.要求计算“科技”大类下“数码测评"子类的视频好评率,则要使用where条件筛选指定大类和子类的数据。

3.因为限定条件要指定视频内容的类别,所以要两个表做关联。

代码如下:

select
count(1) as all_action
sum(case when content_action=‘点赞’ then 1 else 0 end) as like_action
sum(case when content_action=‘点赞’ then 1 else 0 end)/count(1) as like_rate
from content_action_info as a
join dim_content as b
on a.content_id=b.content_id
where b.content_category=‘科技’
and b.content_sub_category=‘数码测评’
and a.create_time between ‘2020-11-01’ and ‘2020-11-30’;

03 使用AB Test评估算法效果

1)需求
某个购物APP最近优化了“猜你喜欢”模块的推荐算法,希望进一步提升推荐的精准度,进而提升销售额。现在需要通过AB Test(50%用户保留原先推荐算法的为控制组,50%用户使用新的推荐算法为实验组)来对新的推荐效果进行评估。假设你是此次实验的数据分析师,请问你会如何评估控制组和实验组的表现?请按重要性列出最重要的三个指标并给出你的分析过程。

2)解题思路

指标:推荐商品的销售额、推荐商品点击率、推荐商品的转化率

分析过程:

1.设原假设为使用新的推荐算法后上述指标降低或不变,备择假设为使用新的推荐算法后上述指标增加。

2.选择显著性水平临界值为5%,并根据指标的预期提升确定样本量和试验周期。

3.样本合理分流,AB测试上线,采集数据。

4.使用T检验,计算P值,进行效果验证。

5.分析结论,如果P值小于5%,那么原假设不成立,备择假设成立,即使用新算法后指标提升。

反之无法推翻原假设,不能证明使用新算法后指标提升.

针对AB Test的拓展阅读,包括如何确定试验样本量和分流,可以翻看公众号历史文章:【长文干货】AB测试:原理流程、实际案例及面试指南。

04 如何评估一场活动的效果

1)需求
某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,作为数据分析师,你如何评估这场活动的效果?

2)解题思路

如果要对一个活动效果进行分析,无非是要回答以下3个问题:

1、活动效果怎么样?要不要继续做?

2、如果可以继续做,活动的做的好的方面是哪些?问题或者瓶颈环节在哪?

3、针对问题环节的改进方案是什么?

具体展开来讲,可以从以下几个方面

1、活动关键指标达成分析

活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?

2、活动关键流程漏斗分析

活动的关键流程是什么?以及各个流程的漏斗分析,定位问题发生的环节。

3、活动的渠道、用户分析

活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?

4、活动策略、节奏分析

活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热、中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预。

以上就是数分面试宝典系列—SQL高频笔试题第6篇文章的内容,部分历史文章请回翻公众号,更多数据分析面试笔试的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享、点赞和收藏哈~

【数据分析面试】字节跳动数据分析面试题(附答案解析)相关推荐

  1. 2020字节跳动数据库面试题及答案(二)—— NoSQL部分

    本文答案整理为原创,转载请说明出处 文章目录 redis 的底层数据结构有哪些 redis 中的 SDS 和 C 语言中的字符串有什么区别,优点是什么 redis 中的字典是如何实现的,如何解决冲突和 ...

  2. java高并发面试题目_列举Java高并发面试题附答案解析

    Java高并发面试题是程序员面试过程中的必修课,只有熟练掌握这些技术要点,在我们的学习中才会脱颖而出,在这里,达内石家庄Java培训老师作深入解答. Java并发面试题附答案 1. 什么是原子操作?在 ...

  3. 列举Java高并发面试题附答案解析

    Java高并发面试题是程序员面试过程中的必修课,只有熟练掌握这些技术要点,在我们的学习中才会脱颖而出,在这里,达内石家庄Java培训老师作深入解答. Java并发面试题附答案 1. 什么是原子操作在J ...

  4. 【Java面试宝典】1000+面试题附答案详解,最全面详细

    进大厂是大部分程序员的梦想,而进大厂的门槛也是比较高的,所以这里整理了一份阿里.美团.滴滴.头条等大厂面试大全,其中概括的知识点有:Java.MyBatis.ZooKeeper.Dubbo.Elast ...

  5. MySQL面试题 | 附答案解析(十七)

    接上篇!!! 9. 主键使用自增ID还是UUID? 推荐使用自增ID,不要使用UUID. 因为在InnoDB存储引擎中,主键索引是作为聚簇索引存在的,也就是说,主键索引的B+树叶子节点上存储了主键索引 ...

  6. MySQL面试题 | 附答案解析(十四)

    接上篇!!! 5. 什么是子查询 (1)QL语句的查询结果做为另一条查询语句的条件或查询结果 (2)SQL语句嵌套使用,内部的SQL查询语句称为子查询. 6. 子查询的三种情况 (1)询是单行单列的情 ...

  7. MySQL面试题 | 附答案解析(二十)

    接上篇!!! 5. MySQL的复制原理以及流程 主从复制:将主数据库中的DDL和DML操作通过二进制日志(BINLOG)传输到从数据库上,然后将这些日志重新执行(重做):从而使得从数据库的数据与主数 ...

  8. MySQL面试题 | 附答案解析(十九)

    数据库优化 1. 为什么要优化 (1)系统的吞吐量瓶颈往往出现在数据库的访问速度上 (2)随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢 (3)数据是存放在磁盘上的,读写速度无法和 ...

  9. MySQL面试题 | 附答案解析(十八)

    接上篇!!! SQL语句优化的一些方法 1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 n ...

  10. MySQL面试题 | 附答案解析(十六)

    接上篇!!! 2. SQL的生命周期? (1)应用服务器与数据库服务器建立一个连接 (2)数据库进程拿到请求sql (3)解析并生成执行计划,执行 (4)读取数据到内存并进行逻辑处理 (5)通过步骤一 ...

最新文章

  1. numpy学习:安装anaconda及使用
  2. aliyun maven 添加jar_gradle添加阿里云maven库
  3. JAVA Socket 底层是怎样基于TCP/IP 实现的???
  4. 牛客多校8 - Interesting Computer Game(并查集)
  5. BTrace简介及使用
  6. python函数参数那些事,关键字参数与位置参数
  7. python汉字长度_行中字符串的长度(Python)
  8. 95-190-640-源码-窗口操作符-WindowOperator
  9. SQL 引擎如何把语句转换为一个抽象语法树?
  10. java毕业设计基于javaweb+mysql数据库实现的大学生助学贷款管理系统(源码+论文+开题报告
  11. 《现代通信原理学习》(二)随机信号分析
  12. 关于 Could not find artifact ...:pom:1.0-SNAPSHOT 的问题!
  13. java中Graphics类的使用
  14. SQL server 认证考试
  15. 第一次搭建ftp遇见的蹩脚的问题
  16. java任务监控进度控制
  17. Spark 和hadoop的一些面试题(准备)
  18. MobaXterm Xwindows打开应用程序模糊、缩放比例不对
  19. IPSEC VPN动态配置(示例)
  20. Quantopian Risk Model (QRM)

热门文章

  1. 全国行政区划代码表-201907更新,三级数据
  2. 利用html编码进行xss攻击
  3. abb机器人过载报错_ABB机器人50295/50296 故障终极解决方法
  4. 【数学建模】2022小美赛C题 人类活动分类(Classify Human Activities)
  5. input获取焦点和失去焦点
  6. wpf使某个控件失去焦点_WPF 在TextBox失去焦点时检测数据,出错重新获得焦点解决办法...
  7. iOS 苹果开发者账号--个人账号,公司账号和企业账号的区别
  8. 邮件服务器4---postfix的主配置文件
  9. 键盘无法使用,管理器显示hid keyboard device 有问题的解决方法
  10. Node+OBS直播服务器搭建总结