前言

19届同学反馈,拼夕夕的数据分析SQL部分出的很好,20届感叹道,说的太对了。

拼夕夕的笔试题一共五道,考试时只划分为一个部分,答题时间90分钟。

第一部分:SQL查询题3道

第一题:活动运营数据分析

表1——订单表orders,大概字段有(user_id‘用户编号’, order_pay‘订单金额’ , order_time‘下单时间’)。

表2——活动报名表act_apply,大概字段有(act_id‘活动编号’, user_id‘报名用户’,act_time‘报名时间’

需求:

1. 统计每个活动对应所有用户在报名后产生的总订单金额,总订单数。(每个用户限报一个活动,题干默认用户报名后产生的订单均为参加活动的订单)。

2. 统计每个活动从开始后到当天(考试日)平均每天产生的订单数,活动开始时间定义为最早有用户报名的时间。(涉及到时间的数据类型均为:datetime)。

第1问:

第2问:

说明:Over函数可以和其它聚集函数、分析函数搭配,起到不同的作用。例如这里的SUM,max,min,avg,还有诸如Rank,Dense_rank等。(mysql支持,hive也支持)

第二题:用户行为分析

表1——用户行为表tracking_log,大概字段有(user_id‘用户编号’,opr_id‘操作编号’,log_time‘操作时间’

需求:

1、计算每天的访客数和他们的平均操作次数。

2、统计每天符合以下条件的用户数:A操作之后是B操作,AB操作必须相邻。

第2问:

在第一问的基础上添加了限制:A操作之后是B操作,AB操作必须相邻。

lead()over()可以轻易的实现!

第三题:用户新增留存分析

表1——用户登陆表user_log,大概字段有(user_id‘用户编号’,log_time‘登陆时间’

要求:

每天新增用户数,以及他们第2天、30天的回访比例

如何定义新增用户:用户登陆表中最早的登陆时间所在的用户数为当天新增用户数;

第2天回访用户数:第一天登陆的用户中,第二天依旧登陆的用户;--次日留存率

第30天的回访用户数:第一天登陆用户中,第30天依旧登陆的用户;

第二部分:计算题1道

贝叶斯公式的应用

已知A,B厂生产的产品的次品率分别是1%和2%,现在由A,B产品分别占60%、40%的样品中随机抽一件,若取到的是次品,求此次品是B厂生产的概率。

已知:P(A)=0.6,P(B)=0.4,P(次/A)=0.01,P(次/B)=0.02

求:P(B/次)

第三部分:综合分析题1道

ABtest

某网站优化了商品详情页,现在新旧两个版本同时运行,新版页面覆盖了10%的用户,旧版覆盖90%的用户。现在需要了解,新版页面是否能够提高商品详情页到支付页的转化率,并决定是否要覆盖旧版,你能为决策提供哪些信息,需要收集哪些指标,给出统计方法及过程。

解答:

使用A/B测试模型,分析两个版本在一段时间期限内,详情页面到支付页面的转化率变化,并计算转化率变化后引起的的GMV变化。

可选择的决策:①确定发布新版本;②调整分流比例继续测试;③优化迭代方案重新开发。

要统计的指标:期限内新、旧版本商品详情页到支付页转化率 ,支付金额。

要衡量的指标:转化率变化 t 在是可接受的置信区间内是否显著,同时参考收益提升率。

指标计算方法:转化率=从某详情页到支付页用户数/浏览该商品详情页用户数(取日平均和标准差)

支付金额=从某详情页到支付页到支付成功路径用户的本次支付金额(取日平均)

采用决策①的情况:本次页面改进在显著性水平内,证明了‘转化率提升的假设’。并且收益提升率达到预期水平。

采用决策②的情况:本次页面改进在显著性水平内,无法证明‘转化率提升的假设’。分析原因可能是新版本样本空间不足。

采用决策③的情况:本次页面改进在显著性水平内,证明了‘转化率提升的假设’。但是收益提升率没有达到预期水平。

文章整理自知乎,作者「求知鸟」


End
    数分技能 | AB测试就该这么分析!    Python数据分析实战 | 同期群分析    同同同期群分析到底是个啥?
数据不吹牛读者群已经建立后台回复“入群”,一起吹水和交流干货

“有用”

2020年PDD数据分析笔试题 | 附解答相关推荐

  1. 「2020」拼多多数据分析笔试题 | 附解答

    19届同学反馈,pdd的数据分析SQL部分出的很好,20届感叹道,说的太对了. pdd的笔试题一共五道,考试时只划分为一个部分,答题时间90分钟. 第一部分:SQL查询题3道 第一题:活动运营数据分析 ...

  2. 拼多多数据分析笔试题(附代码答案)

    一个拼多多数据分析笔试题分享给大家,附上参考答案,如有更好解法,欢迎交流学习- 文章目录 第一部分:SQL查询题3道 第一题:活动运营数据分析 需求 第1问 第2问 技术提升 第二题:用户行为分析 需 ...

  3. 【MySQL】PDD数据分析笔试题

    转载自https://www.cnblogs.com/hider/p/12642452.html https://blog.csdn.net/SeizeeveryDay/article/details ...

  4. 小红书2020校招数据分析笔试题卷四 解析

    小红书2020校招数据分析笔试题卷四 解析 单选题 多选题 填空题 简答题 题目来自小红书2020校招数据分析笔试题卷四 单选题 如果在小红书商城中某一商户给一产品定价,如果按照全网最低价500元定价 ...

  5. 2020年小红书校招数据分析笔试题

    今天给大家带来2020年小红书校招的数据分析笔试题的详解 1.如果在小红书商城中某一商户给一产品定价,如果按照全网最低价500元定价,那么客人就一定会选择在此购买:价格每增加1元,客人的流失的可能性就 ...

  6. 美团点评2020年测试工程师笔试题

    VOL 155 04 2020-09 今天距2021年118天 这是ITester软件测试小栈第155次推文 点击上方蓝字"ITester软件测试小栈"关注我,每周一.三.五早上  ...

  7. 搜狗2020年测试工程师笔试题

    VOL 151 21 2020-08 今天距2021年132天 这是ITester软件测试小栈第151次推文 点击上方蓝字"ITester软件测试小栈"关注我,每周一.三.五早上  ...

  8. 潇洒郎: 去哪儿2021届/2020年开发岗笔试题分享

    去哪儿2021届/2020年开发岗笔试题分享 1. 2020年,直播已经成为去哪儿网酒店预售的新武器, 去哪儿网CEO刚哥想从公司的m名员工中挑选n名参与自己的直播,已知m小于100请问一共有多少种选 ...

  9. BI数据分析笔试题及答案(华为音乐外包)

    BI数据分析笔试题 一.华为音乐外包 1.数据仓库测试 2.可视化时间空间数据 3.信息与熵的计算 4.基本数据的元数据 5.数据粒度 6.数据预处理 7.非对称二元属性 8.特征工程 9.KDD 1 ...

最新文章

  1. 终端证书文件批量导入数据库的Python源码
  2. 给你总结了这些对付幂等性的套路
  3. C、C++不定参数的使用
  4. SQLServer 2014 本地机房HA+灾备机房DR解决方案
  5. WebAPI(part4)--操作元素
  6. snmp服务中snmpwalk命令常用方法总结
  7. IDC:第一季度全球服务器市场收入下滑4.6% 市场为重大升级做准备
  8. 深入css布局 (3)完结 — margin问题与格式化上下文
  9. No module named scrapy 成功安装scrapy,却无法import的解决方法
  10. 猴子都能懂的数据库范式详解
  11. 利用宝塔面板部署SSM项目
  12. PMP-专家判断、类比估算、参数估算、三点估算、自下而上估算、独立估算的区别
  13. 计算机中硬盘容量的单位,硬盘容量的单位和计算单位是什么?
  14. VSCode插件Code Runner用于C++
  15. 第七十一章 SQL函数 LAST_DAY
  16. ios android 系统占用空间,iOS 系统占用了 20G 储存空间?别担心,教你快速解决!...
  17. 语文老师之二小白的边城
  18. 博弈论中的零和对策和非零和对策
  19. 四川多多开店:拼多多如何获取好的评价
  20. 网络工程管理 第七章 应用层协议 万维网 DNS 电子邮件 FTP DHCP TELNET

热门文章

  1. 软考集成教程考点精讲之实施定量风险分析
  2. 用python写网络爬虫
  3. VGG16のFine-tuning技术识别17种花
  4. 关于学生课堂行为识别算法
  5. 数据分析中-比python更趁手的兵器-下篇
  6. 一行代码解决Vue跨域请求Vue报错:AxiosError
  7. 【转】iOS 开发怎么入门?
  8. 倒啤酒竟能拿到诺贝尔物理学大奖!明明是普通操作,凭什么这么强?
  9. 深度学习入门demo mnist
  10. Docker方式安装巡风