阅读文本大概需要 13分钟。


2018 注定是不平凡的一年,这一年有太多我们熟知的大师离去。他们的离去代表着一个时代的终结,也代表这我们 90 后青春的落幕。我们这代 90 后是个男生都会看场 NBA 的比赛。

2013 那年我高二也是 NBA 球队热火队最火爆的时期,詹伟连线无人可挡。

那年的总决赛,热火大比分 2-3 落后马刺,当时第六场的最后几秒热火的比分还是落后于马刺,眼看就要输掉了比赛。那时候我们还在上课,但为了看热火这场生死大战,我和几个死党一起逃课。当时我们都觉得热火已经没有希望了,都准备要回去,但就在比赛快要结束时雷阿伦投入高难度扳平三分,从而把比赛拖入加时,最终逆转夺冠!我们几个当场就大喊起来:热火牛逼!

绝杀总是能让人激动不已!在NBA历史上,留下了不少的经典绝杀!我们的闪电侠韦德也是个中佼佼者,其中 2009 年对阵公牛一役完成抢断三分绝杀就是一大例证,绝杀之后韦德跑到站台上更是霸气的喊到「This is my house」。

当年的热火给我们的青春带来了太多的回忆,虽然曾经的队友,早已成为了彼此的对手。就像当年一起通宵的死党,如今都已变成陌生人,都在为现实奔波。

而就在昨天 12 月 11 日美国当地时间 10 日晚,NBA 常规赛湖人主场迎战热火队,这也是詹姆斯和韦德生涯最后一次常规赛对决。这场比赛就像多年以后老朋友再次相见,有太多不舍的回忆。赛后詹姆斯和韦德生互相交换了球衣,这个场景不知戳中多少球迷的心。

今天就带大家用 Python 分析韦德职业生涯的数据,多年以后或许还可以拿出这篇文章给自己的孩子诉说这自己的青春。

数据获取

数据的来源主要是爬 basketball-reference 网站上的数据。

网站地址:

https://www.basketball-reference.com/players/w/wadedw01.html

网站把韦德所有的生涯数据都展示出来,结构也很清晰我们只要用 requests + pyquery 解析就好。

最后我们把解析到的数据利用 pandas 保存到 excel 中即可。

具体的爬虫代码如下:

from pyquery import PyQuery as pq
from fake_useragent import UserAgent
import requests
import pandas as pd

def parse_html():
    url = "https://www.basketball-reference.com/players/w/wadedw01.html"
    ua = UserAgent()
    headers = {"User-Agent": ua.random}
    reponse = requests.get(url, headers=headers)
    if reponse.status_code == 200:
        html = reponse.text
        extract_htm(html)

def extract_htm(html):
    doc = pq(html)
    Dwyane_Wade_data = []
    data_items = doc.find("#div_per_game #per_game tbody tr").items()
    for itme in data_items:
        season = itme.find("th[data-stat='season'] a").text()
        age = itme.find("td[data-stat='age']").text()
        team = itme.find("td[data-stat='team_id'] a").text()
        league = itme.find("td[data-stat='lg_id'] a").text()
        position = itme.find("td[data-stat='pos']").text()
        games = itme.find("td[data-stat='g']").text()
        games_started = itme.find("td[data-stat='gs']").text()
        minutes_played_per_game = itme.find("td[data-stat='mp_per_g']").text()
        field_goals_per_game = itme.find("td[data-stat='mp_per_g']").text()
        field_goals_attempts_per_game = itme.find("td[data-stat='fga_per_g']").text()
        field_goal_percentage = itme.find("td[data-stat='fg_pct']").text()
        point_3_field_goal_per_game = itme.find("td[data-stat='fg3_per_g']").text()
        point_3_field_goal_percentage = itme.find("td[data-stat='fg3_pct']").text()
        point_2_filed_goals_per_game = itme.find("td[data-stat='fg2_per_g']").text()
        point_2_filed_goals_attempts_per_game = itme.find("td[data-stat='fg2a_per_g']").text()
        fg2_pct = itme.find("td[data-stat='fg2_pct']").text()
        efg_pct = itme.find("td[data-stat='efg_pct']").text()
        ft_per_g = itme.find("td[data-stat='ft_per_g']").text()
        fta_per_g = itme.find("td[data-stat='fta_per_g']").text()
        ft_pct = itme.find("td[data-stat='ft_pct']").text()
        orb_per_g = itme.find("td[data-stat='orb_per_g']").text()
        drb_per_g = itme.find("td[data-stat='drb_per_g']").text()
        trb_per_g = itme.find("td[data-stat='trb_per_g']").text()
        ast_per_g = itme.find("td[data-stat='ast_per_g']").text()
        stl_per_g = itme.find("td[data-stat='stl_per_g']").text()
        blk_per_g = itme.find("td[data-stat='blk_per_g']").text()
        tov_per_g = itme.find("td[data-stat='tov_per_g']").text()
        pf_per_g = itme.find("td[data-stat='pf_per_g']").text()
        pts_per_g = itme.find("td[data-stat='pts_per_g']").text()
        item_data = {'season': season, "age": age, "team": team, "league": league, "position": position, "games": games,
                "games_started": games_started, "minutes_played_per_game": minutes_played_per_game, "field_goals_per_game": field_goals_per_game,
                "field_goals_attempts_per_game": field_goals_attempts_per_game, "field_goal_percentage": field_goal_percentage,
                "point_3_field_goal_per_game": point_3_field_goal_per_game, "point_3_field_goal_percentage": point_3_field_goal_percentage,
                "point_2_filed_goals_per_game": point_2_filed_goals_per_game, "point_2_filed_goals_attempts_per_game": point_2_filed_goals_attempts_per_game,
                "fg2_pct": fg2_pct, "efg_pct": efg_pct, "ft_per_g": ft_per_g, "fta_per_g": fta_per_g, "ft_pct": ft_pct,
                "orb_per_g": orb_per_g, "drb_per_g": drb_per_g, "trb_per_g": trb_per_g, "ast_per_g": ast_per_g, "stl_per_g": stl_per_g,
                "blk_per_g": blk_per_g, "tov_per_g": tov_per_g, "pf_per_g": pf_per_g, "pts_per_g": pts_per_g}
        print(item_data)
        Dwyane_Wade_data.append(item_data)

data = pd.DataFrame(Dwyane_Wade_data)
    data.to_csv("Dwyane_Wade_data.csv", encoding='utf_8_sig')

if __name__ == '__main__':
    parse_html()

最后保存的 excel 表如下:

出场次数和首发数据分析

首先我们对韦德生涯参加的场数和时间进行一个分析。

games:参与的比赛场数(都为82场)

games_start: 先发次数

age:年龄

minutes_played: 平均每场比赛进行的时间

韦德 22 岁就进入 NBA 打比赛,出道就打了 61 场比赛,首发 56 场,往后的几年时间里都是打球队首发人员。一个赛季按 82 场来算,韦德在 2008 - 09 赛季恐怖的达到了 79 场比赛。

平均每场比赛时间都在 30 分钟以上。

从这些数据可以看出韦德是队伍中的主力军,绝对的领袖。

投球命中率

韦德投球命中率平均在 0.47 。

2013-14 赛季达到职业生涯最大命中率:0.55。

由于篇幅的问题其他的数据就暂时不再继续分析,感兴趣的同学可后台回复「nba」获取相应的源代码进行分析,这里给大家一个单词对照表。

数据名 含义
Rk -- Rank 排名
G -- Games 参与的比赛场数(都为82场)
MP -- Minutes Played 平均每场比赛进行的时间
FG--Field Goals 投球命中次数
FGA--Field Goal Attempts 投射次数
FG%--Field Goal Percentage 投球命中次数
3P--3-Point Field Goals 三分球命中次数
3PA--3-Point Field Goal Attempts 三分球投射次数
3P%--3-Point Field Goal Percentage 三分球命中率
2P--2-Point Field Goals 二分球命中次数
2PA--2-point Field Goal Attempts 二分球投射次数
2P%--2-Point Field Goal Percentage 二分球命中率
FT--Free Throws 罚球命中次数
FTA--Free Throw Attempts 罚球投射次数
FT%--Free Throw Percentage 罚球命中率
ORB--Offensive Rebounds 进攻篮板球
DRB--Defensive Rebounds 防守篮板球
TRB--Total Rebounds 篮板球总数
AST--Assists 辅助
STL--Steals 偷球
BLK -- Blocks 封阻
TOV -- Turnovers 失误
PF -- Personal Fouls 个犯
PTS -- Points 得分

在很多年后,当老詹和骚韦挺着日渐臃肿的肚子来到球场,看着场上的小詹和小腮帮在球场上尽情挥洒着天赋,一次次的空接暴扣,一次次的抢断反击,听着场下一声又一声的呐喊,会不会忽然就湿润了眼眶。

此文纪念我们逝去的青春。

推荐阅读:

我们的青春已落幕,用 Python 分析韦德职业生涯数据相关推荐

  1. 【可视化分析案例】用python分析Top100排行榜数据

    目录 一.数据源 二.数据读取 三.数据概览 四.数据清洗 五.可视化分析 5.1 相关性分析(Correlation) 5.2 饼图(Pie) 5.3 箱形图(Boxplot) 5.4 词云图(wo ...

  2. [机器学习笔记] 用Python分析 TED演讲数据(更新中)

    用Python分析 TED演讲数据 首先准备TED演讲数据集,TED演讲数据集和信息可以从下面的资源获得: https://www.datafountain.cn/datasets/11 该数据集包含 ...

  3. 南方人过冬靠的是一身正气?用Python分析全网取暖器数据

    本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理. 以下文章来源于CDA数据分析师 ,作者:CDA数据分析师 前言 如果说冬天对北方人来说只是一个季节 ...

  4. 一键备份微博并导出生成PDF,顺便用Python分析微博账号数据!

    这里再分享下如何快速导出你的所有微博数据,然后用Python分析某个微博账号的数据,比如高赞,转发,评论微博,微博词云,微博发布时间轴,以及使用的手机. 稳部落 这是一个专业备份导出微博记录工具 ht ...

  5. 一键备份微博并导出生成PDF,顺便用Python分析微博账号数据

    苏生不惑第139 篇原创文章,将本公众号设为星标,第一时间看最新文章. 关于微博之前写过以下文章: 那些你可能不知道的微博奇技淫巧 想方便快捷的分享/收藏图片?试试免费好用的微博/b站图床 如何轻松下 ...

  6. 通过python分析微信好友数据

    随着微信的普及,越来越多的人开始使用微信.微信渐渐从一款单纯的社交软件转变成了一个生活方式,人们的日常沟通需要微信,工作交流也需要微信.微信里的每一个好友,都代表着人们在社会里扮演的不同角色.今天这篇 ...

  7. 学霸用 Python 分析相亲网站数据,在两万异性中找到真爱!

    微信搜 "GitHubDaily" 点关注 设为 "星标",每天带你逛 GitHub! 转自大数据文摘 来源:Wired 编译:啤酒泡泡.张大笔茹.张睿毅.牛婉 ...

  8. python分析政策实施前后_使用Python分析北京积分落户数据,分析完我陷入了深思...

    北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献.专业技能.在京时间等指标为考核项,计算非京籍人才的"积分",积分达标即可落户北京.也给了我们一众北漂希望,毕竟随着时间的 ...

  9. 使用Python分析北京积分落户数据,分析完我陷入了深思

    这是学习笔记的第 2183 篇文章 读完需要 9 分钟 速读仅需5分钟 北京积分落户制是北京市政协建议推行积分落户政策,以科技贡献.专业技能.在京时间等指标为考核项,计算非京籍人才的"积分& ...

  10. python处理考勤数据_你真知道自己加了多少班吗?来来来,用Python分析一下考勤数据就知道了...

    前段时间给同事做Python爬虫技术分享,为了分享的效果以及听众的兴趣,写了一个爬取考勤数据的小爬虫.内容比较简单,以下做一个梳理: 一.问题分析 先梳理下查询考勤的流程: 登录公司内网的系统 切换到 ...

最新文章

  1. rdd与mysql表 join_6、JdbcRDD读取mysql的数据
  2. R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加箱图、带缺口的小提琴图、小提琴图)实战
  3. .NET 中关于 TypeCode 和枚举类型的问题
  4. 程序员父亲的遗产——编程十诫
  5. 生成SSH秘钥连接github
  6. 初中三年级计算机课程教案,三年级信息技术教案下
  7. linux驱动编写(platform总线和网卡驱动)
  8. (补)20200105:整数转罗马数字
  9. 彻底搞懂git rebase命令
  10. python vba excel课程_Excel办公自动化—VBA 及编程入门指南
  11. 辨别 优盘 真假 [金士顿]
  12. 我在GitHub上找到了这些游戏项目,刺激!
  13. couchbase php,CouchBase + PHP 安装与配置
  14. python和r哪个实用_R和Python谁更好?
  15. 远程连接mscs下oracle,MSCS+FailSafe ORACLE数据库双机集群做HA小结
  16. centos 7.6编译安装nginx
  17. 氨基酸密码子表(Amino Acid Codon)
  18. 功能:批量查询和导出工艺路线
  19. 字体设计编辑软件Glyphs 2 for mac中文版v2.6.6(1350)
  20. 什么是 EventLoop ?

热门文章

  1. 华为usg6320服务器映射,华为防火墙USG6320配置(简单)
  2. 三个步骤教你-----如何实现DHCP中继配置
  3. Android Studio中HTTP的请求
  4. 【目标检测】“复制-粘贴”数据增强实现
  5. 微信开放平台应用申请
  6. NPN与PNP的区别与判别
  7. 自组织特征图(SOFM)详解
  8. 【Lintcode】507. Wiggle Sort II
  9. 广州三本找Java实习经历
  10. WordPress防止自动压缩jpg图片