篮球比赛中的投篮选择

参加过篮球比赛的同学,在球场上是否有这样的经历?
当上一次投篮未命中时,你会倾向于比上一次更近的距离出手投篮,当上一次投篮稳稳命中时,你会想尝试下比上一次更更远距离的出手。于是,抓取了一些NBA球员的数据,来看看他们在这些情况下,做出怎样的投篮选择?

1,数据准备

本次的数据来自于 https://www.basketball-reference.com/,这里有很多有意思的数据,这次主要抓取的是shooting,这里记录球员的所有投篮数据,包括出手位置、出手距离、投篮结果、分值(2/3)等。但是现在网站已有反爬,数据不好抓取。

主要抓取现役常规赛总得分的前十名球员数据。詹姆斯、安东尼、杜兰特、哈登、维斯布鲁克、保罗、库里、阿尔德里奇、德罗赞、霍华德。20w+行数据。

对数据进行处理后,得到数据集

字段说明

字段 描述
top 投篮点纵坐标,背景图片中到球场的上沿距离
left 投篮点横坐标,背景图片中到球场的左侧距离
game_date 比赛时间
team 比赛双方队伍
shot_result 本次投篮结果,Made:命中,Missed:未命中
points 得分,2 分球 or 3分球
distance 投篮点到篮筐距离,单位:ft(英尺)
player_name 球员名称
pre_shoot_result 上一次投篮结果,Made:命中,Missed:未命中
dist_diff 本次投篮点distance 与 上一次投篮点distance 差值,本次distance - 上一次distance,单位:ft(英尺)

2,数据分析

# 分离数据集
after_made = df[df.pre_shoot_result == 'Made']   # 上一次命中
after_miss = df[df.pre_shoot_result =='Missed']  # 上一次未命中

after_made.dist_diff.describe()
"""
count    90703.000000
mean         2.764738
std         12.134524
min        -36.000000
25%         -3.000000
50%          1.000000
75%         11.000000
max         39.000000
Name: dist_diff, dtype: float64
"""
after_miss.dist_diff.describe()
"""
count    97785.000000
mean        -2.521726
std         12.563584
min        -39.000000
25%        -12.000000
50%         -1.000000
75%          5.000000
max         39.000000
Name: dist_diff, dtype: float64
"""

从整体均值看,命中后,会选择更远的距离出手,反之,会选择更近的距离出手。

print('投失后,下次投篮距离变近比例:{:.2%}'.format(len(after_miss[after_miss.dist_diff < 0])/len(after_miss)))
print('投失后,下次投篮距离变远比例:{:.2%}'.format(len(after_miss[after_miss.dist_diff >= 0])/len(after_miss)))
print('命中后,下次投篮距离变近比例:{:.2%}'.format(len(after_made[after_made.dist_diff < 0])/len(after_made)))
print('命中后,下次投篮距离变远比例:{:.2%}'.format(len(after_made[after_made.dist_diff >= 0])/len(after_made)))

投失后,下次投篮距离变近比例:55.03%
投失后,下次投篮距离变远比例:44.97%
命中后,下次投篮距离变近比例:34.65%
命中后,下次投篮距离变远比例:65.35%
从细分的结果来看,也是得出相同结论:命中后,会选择更远的距离出手,反之,会选择更近的距离出手

在从距离差值直方图来看,在差值< 0的部分,未命中的累计曲线比命中的累计曲线要陡峭的多,也说明了相同结论。

然而,还可以提出一个新问题,球员投篮命中率会不会受到他们之前是否命中的影响?

print('投失后,本次投篮命中率:{:.2%}'.format(len(after_miss[after_miss.shoot_result =='Made'])/len(after_miss)))
print('命中后,本次投篮命中率:{:.2%}'.format(len(after_made[after_made.shoot_result =='Made'])/len(after_made)))

投失后,本次投篮命中率:48.46%
命中后,本次投篮命中率:47.28%

从计算结果,可以得出:球员投篮命中的几率不会受到他们之前是否命中的影响,每次投篮都是独立事件,跳起来投篮就像扔硬币,所谓“火热手感”也并不存在。

基于这些数据,你还有什么其他分析想法吗?欢迎评论交流!!!

【数据说第四期】篮球比赛中的投篮选择相关推荐

  1. 十二届蓝桥杯第四期模拟比赛

    十二届蓝桥杯第四期模拟比赛 填空题 1.质数计算 2.ASCII码查数问题 3.Fibonacci问题 4.树结点问题 5.位权问题 代码题 6.小红买东西 7.英文单词首字母大写 8.列表数之间的度 ...

  2. 在篮球运动中,领先多少分才安全。体育作家Bill 开发了一个算法,用于判断篮球比赛中怎样的领先优势是不可超越的

    在篮球运动中,领先多少分才安全.体育作家Bill 开发了一个算法,用于判断篮球比赛中怎样的领先优势是不可超越的.他的算法如下: (1) 获取领先一队当前的得分数 (2) 得分数减去三分 (3) 如果目 ...

  3. 云原生社区 meetup 第四期广州站报名中

    继 4 月 17 日杭州站 meetup 之后,云原生社区的第四次线下 meetup 来了,不仅有来自大厂的云原生工程师现场交流,更有<Knative 实战>.<Kubernetes ...

  4. 【CLS数据淘金第四期】网络流日志-云联网日志分析

    导语 云联网(Cloud Connect Network,CCN)云联网覆盖全球 20+ 地域,提供云上私有网络间(VPC).VPC 与本地数据中心间(IDC)内网互联的服务,具备全网多点互联.路由自 ...

  5. 第五十四期:MongoDB与MySQL:如何选择

    MongoDB和MySQL分别是领先的开源NoSQL和关系数据库.哪个最适合您的应用程序? 作者:XEyes行走的CODE来源 MongoDB和MySQL分别是领先的开源NoSQL和关系数据库.哪个最 ...

  6. 湖上建仓全解析:如何打造湖仓一体数据平台 | DEEPNOVA技术荟系列公开课第四期

    如今,面对数字化快速发展带来的挑战,现代化企业需要打破以往数据的孤岛,让数据从采集.加工.管理到应用,是统一的数据存储和数据处理,甚至是作为全栈式的湖仓一体数据平台,以支撑各类数据赋能业务,进而创造更 ...

  7. cdn 中移集采_中兴通讯中标中国移动融合CDN四期集采新建项目

    近日,中国移动进行了CDN网络2020年集采招标,中兴通讯CDN获得新建部分60%的份额,展现了其技术持续领先.市场稳步突破的实力. 中国移动CDN网络,是构建在IP承载网之上,具有就近内容分发和集中 ...

  8. CSDN 编程竞赛十四期题解

    竞赛总览 CSDN编程竞赛十四期:比赛详情 (csdn.net) 本次竞赛题目难度适中,并且题目的解法(思路)也比较多,很适合新人学习. 竞赛题解 题目1.字符串全排列 对K个不同字符的全排列组成的数 ...

  9. CSDN 编程竞赛二十四期题解

    竞赛总览 CSDN 编程竞赛二十四期:比赛详情 (csdn.net) 本次竞赛感觉打模板的题变少了,而且多了很多可以集思广益的题目,参赛体验很好. 竞赛题解 题目1.计数问题 试计算在区间1到n的所有 ...

  10. 第四期:有关大数据相关问答汇总,持续更新中~

    NO.1 大数据为什么这么"火"?为什么那么多人转型学大数据? 回答一:身为数据极客,在2017年应该能感觉很幸福. 去年,我们曾经问过大家"大数据还是个值得关注的大事吗 ...

最新文章

  1. vi 查看最顶部_5分钟带你进入 Vim 大门,让你喜欢 Vim
  2. 深度学习实践:计算机视觉_深度学习与传统计算机视觉技术:您应该选择哪个?
  3. easyui input输入框的限制和校验条件
  4. 高通计划通过多层级骁龙5G移动平台 加速5G商业化
  5. 数据结构 2-3-3 循环链表
  6. net core体系-web应用程序-4asp.net core2.0 项目实战(1)-10项目各种全局帮助类
  7. tf.nn.rnn_cell.DropoutWrapper用法细节案例1
  8. (转)悟透javascript
  9. 【学习笔记】C# 动态系统托盘图标的实现 - NotifyIcon控件
  10. [OfficeExcel] 王佩丰老师OfficeExcel2010 1-4讲 Excel基本操作 学习笔记
  11. 关于符号Symbol第一篇
  12. word2007表格计算机,电脑员好做吗?使用word2007表格?
  13. 情人节送什么礼物好呢?实用又有纪念意义的礼物推荐
  14. 立方体三维之立方体平行投影
  15. 分享微信公众号留言评论功能开通方法
  16. vue点击预览图片插件(可放大缩小翻转等)
  17. 简单的数据库设计文档
  18. 电视剧《我是业主》演员表,主要演员
  19. python循环基本语法
  20. 职高计算机word教学视频,浅谈中职《计算机应用基础》Word教学方法

热门文章

  1. 剑指offer 面试题46 python版+解析:把数字翻译成字符串
  2. TabLayout自定义Indicator
  3. 特拉华大学计算机专业,特拉华大学电气与计算机工程专业设置及申请条件汇总 顶尖名校专业解析!...
  4. SSM_JSON格式增删改查
  5. Javaeve博客教你怎么发带图片的博客,非其他网络连接图片
  6. swiper3 匀速无缝滚动
  7. ffmpeg实现flv至mp4格式转换的bat脚本
  8. 「CSS畅想」好友想回忆童年,安排~为她做了一个果宝特攻的换装
  9. 在安装office2003时,出现安装程序包的语言不受系统支持的错误,如何解决?
  10. Matlab论文插图绘制模板第60期—瀑布图(Waterfall)