数据来源:NBA中国官网

库:

requests 用于解析页面文本数据

pandas   用于处理数据

时间:

2017/2/17 (因为为现役球员,故需注明时间节点)

开工:

得到了数据,这下就好办了

先上简单粗暴够用的代码

importrequests2 importpandas as pd3 user_agent = ‘User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)‘

4 headers = {‘User-Agent‘:user_agent}5 url=‘http://china.nba.com/static/data/league/playerlist.json‘

6 #解析网页

7 r=requests.get(url,headers=headers).json()8 num=int(len(r[‘payload‘][‘players‘]))-1 #得到列表r[‘payload‘][‘players‘]的长度

9 p1_cols=[] #用来存放p1数组的列

10 p2_cols=[] #用来存放p2数组的列

11 #遍历其中一个[‘playerProfile‘],[‘teamProfile‘] 得到各自列名,添加到p1_cols和p2_cols列表中

12 for x in r[‘payload‘][‘players‘][0][‘playerProfile‘]:13p1_cols.append(x)14 for y in r[‘payload‘][‘players‘][0][‘teamProfile‘]:15p2_cols.append(y)16 p1=pd.DataFrame(columns=p1_cols) #初始化一个DataFrame p1 用来存放playerProfile下的数据

17 p2=pd.DataFrame(columns=p2_cols) #初始化一个DataFrame p1 用来存放playerProfile下的数据

18 #遍历一次得到一个球员的信息,分别添加到DataFrame数组中

19 for z inrange(num):20 player=pd.DataFrame([r[‘payload‘][‘players‘][z][‘playerProfile‘]])21 team=pd.DataFrame([r[‘payload‘][‘players‘][z][‘teamProfile‘]])22 p1=p1.append(player,ignore_index=True)23 p2=p2.append(team,ignore_index=True)24 p3=pd.merge(p1,p2,left_index=True,right_index=True) #数据合并

25 p3.to_csv(‘f://NBA//nba_player.csv‘,index=False)

只能说简单粗暴,25行代码搞定,恩,不过数据已经拿到手。

接下来查看一下

数据量不大,也可以用EXCEL来‘偷窥‘

拿到数据,总得稍微把玩一下,才对得起这堆数据,不然和撩到了步行街标准9分妹子就分手有什么区别呢?

了解下基本的数据情况

截止全明星赛前有449名现役球员

那么各球队球员数量具体是多少呢?

老詹的骑士还差个控位,湖人在为明年做准备

很想了解下NBA球员国籍‘country‘的情况

也就是说449名现役大名单球员里,有340名美国佬咯,螺旋稳

其中,

亚洲帅哥2枚,格鲁吉亚的Zaza Pachulia 和 以色列的Omri Casspi 撑场

非洲在大帝的领导下,率将领14名出征,NBA官网上28卡国籍是刚果。

欧洲55人;大洋洲8人(澳大利亚7人,新西兰1人);南美12人;还有4人,暂且未知(NBA数据库未补充)

接下来,看一下现役球员中,每一届球员的情况

98届的 Vince Carter,Paul Pierce,Dirk Nowitzki

99届的Manu Ginobili,Jason Terry,Metta World Peace

00届的Jamal Crawford,Mike Miller

01届的Tyson Chandler,Pau Gasol,Richard Jefferson,Joe Johnson,Tony Parker,Zach Randolph

02届的Matt Barnes,Mike Dunleavy,Udonis Haslem,Nene,Luis Scola

终有一天他们会离去,就像去年夏天的Tim,Bryant 和 Kevin

还是那句话,老兵不死,只是凋零。

03白金一代也只有12人在战斗了,当安东尼顶替乐福进入16/17/全明星赛时,老詹说自己不再是年龄最大的那位了,当时的你又在想啥呢?

这里我们需要再看一项数据,就是NBA现役球员的NBA平均职业生涯年龄是多少呢?

现役球员平均职业年龄为4.76年。

新生代球员配上新时代的体系及打法,NBA也是越来越好看,越来越激烈。每一位成功的球员都是为那个时代而生的。

下面,我们看一个很有意思的数据

现役NBA球员,最受欢迎的号码前5是哪几个号码呢?

只能说,666。原来5号,8号这么受欢迎。

还有,我们平时看NBA,主播评论员都是只说美国人的lastName,所以有时候一个队有几个汤普森或者约翰逊,满脸茫然

朋友,我会告诉你,共有7个约翰逊,统统来自美国。东部4个约翰逊,西部3个约翰逊。

热火VS快船比赛解说可能就是,约翰逊外线传球给约翰逊被杀出来的约翰逊抢断成功,掩耳不及迅雷之势传给快下的约翰逊,轻松扣篮得手。

那球员的位置分布怎么样呢?小球时代,自我感觉整个联盟后场球员会遥遥领先前场球员,一起来看看,果不其然。

今天就聊到这里吧

还有许多有趣的字段,有待开发。无兄弟,不篮球,期待与大伙一起为了我们兴趣,一起讨论交流,

I am a JRS,We are family ,他强任他强。

小白一枚,能力有限,做的不好的地方,尤其是逻辑与思维上的东西,需要大神们看到了多多指教和斧正buddyquan。

QQ:1749061919 小白爬虫求带

python分析出nba球员的位置_python抓取NBA现役球员基本信息数据并进行分析相关推荐

  1. 小猪的Python学习之旅 —— 14.项目实战:抓取豆瓣音乐Top 250数据存到Excel中

    小猪的Python学习之旅 -- 14.项目实战:抓取豆瓣音乐Top 250数据存到Excel中 标签:Python 一句话概括本文: 利用Excel存储爬到的抓取豆瓣音乐Top 250数据信息,还有 ...

  2. python分析出nba球员的位置_Python告诉你NBA球星都喜欢在哪个位置出手?

    作者 | Crossin先生 导读:NBA 2018-19 赛季已经落下帷幕,猛龙击败勇士,成为新科冠军球队.近日各队纷纷发布2019-20季前赛赛程,迎接新赛季. 我想,不如来做个 NBA 相关的数 ...

  3. python关键词排名_Python抓取爱站关键词排名数据

    Python批量下载爱站的关键字排名数据,非常好用.直接上代码: # -*- coding: utf-8 -*- from cPAMIE import PAMIE import os from Bea ...

  4. python抓取网页信息_python抓取网页中的动态数据

    一.概念 网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...

  5. 【Python 爬虫简单的JavaScript逆向实战】抓取中国电影票房的数据

    开篇闲聊 最近也是看完了崔庆才爬虫52讲里面JavaScript逆向部分,里面介绍了从简单到复杂整个JavaScript逆向的方法,里面也有一些实战案例(可以练习的),跟着视频练习之后,虽然也成功了, ...

  6. python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...

    python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07

  7. python爬虫搜特定内容的论文_python爬取指定微信公众号文章

    python怎么抓取微信阅清晨的阳光比不上你的一缕微笑那么动人,傍晚的彩霞比不上你的一声叹息那么心疼,你的一个个举动,一句句话语都给小编带来无尽的幸福. 抓取微信公众号的文章 一.思路分析 目前所知晓 ...

  8. 使用Python抓取猫眼近10万条评论并分析

    <一出好戏>讲述人性,使用Python抓取猫眼近10万条评论并分析,一起揭秘"这出好戏"到底如何? 黄渤首次导演的电影<一出好戏>自8月10日在全国上映,至 ...

  9. python 抓取解析接口数据_[干货]用python抓取摩拜单车API数据并做可视化分析(源码)...

    原标题:[干货]用python抓取摩拜单车API数据并做可视化分析(源码) 在APP中能看到很多单车,但走到那里的时候,才发现车并不在那里.有些车不知道藏到了哪里:有些车或许是在高楼的后面,由于有GP ...

最新文章

  1. 阿里云 centos oracle安装
  2. python二十五:装饰器
  3. 如何安装Pycharm官方统计代码行插件
  4. Sencha Touch 打包javaScript 和 css
  5. 超干货 | 一线从业者实践案例大分享:To B行业如何做增长
  6. 在CentOS6.x下安装Compiz——桌面立方体,特效种种
  7. notepad++ json插件_Emmet--Web前端工具,需要安装插件在sublime里
  8. linux下简易搭建svnserver
  9. mysql新手常见问题_MySQL数据库入门-新手常见问题答疑
  10. java实现kotlin接口_Kotlin 接口与 Java8 新特性接口详解
  11. 【MySQL】011-多表查询
  12. Tk/Tkx滚动条的使用
  13. Akka默认20s超时修改配置
  14. RK3566和S905X3/S905X4对比哪个好?
  15. [机房练习赛4.7] 深意 KMP
  16. CUDA加速计算的基础C/C++
  17. android获得键盘高度,Android 获取键盘高度,显示键盘和隐藏键盘
  18. [ffmpeg]ffmpeg yasm not found, use --disable-yasm for a crippled build
  19. Android .9图片制作教程(二)
  20. hive增量表和全量表_你需要了解的全量表,增量表及拉链表

热门文章

  1. 数组长度(array.length)
  2. ES6转ES5 Traceur转码器
  3. 使用HBuilder - wap2app 打包vue写的移动端项目 禁用原生标题栏
  4. 一线|领英“女性职业机会”调研显示,新兴职业对于女性优势明显
  5. 宝宝有这些表现正不正常?我来告诉你
  6. jQuery中淡入效果fadeTo
  7. 关闭计算机休眠文件,如何对Windows系统休眠文件瘦身并释放C盘?
  8. java中scanner是什么意思_java中Scanner是什么?怎么用?
  9. 踩坑记录(21--30)
  10. python console作用_pycharm run in python console和直接运行