python分析出nba球员的位置_python抓取NBA现役球员基本信息数据并进行分析
数据来源:NBA中国官网
库:
requests 用于解析页面文本数据
pandas 用于处理数据
时间:
2017/2/17 (因为为现役球员,故需注明时间节点)
开工:
得到了数据,这下就好办了
先上简单粗暴够用的代码
importrequests2 importpandas as pd3 user_agent = ‘User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0)‘
4 headers = {‘User-Agent‘:user_agent}5 url=‘http://china.nba.com/static/data/league/playerlist.json‘
6 #解析网页
7 r=requests.get(url,headers=headers).json()8 num=int(len(r[‘payload‘][‘players‘]))-1 #得到列表r[‘payload‘][‘players‘]的长度
9 p1_cols=[] #用来存放p1数组的列
10 p2_cols=[] #用来存放p2数组的列
11 #遍历其中一个[‘playerProfile‘],[‘teamProfile‘] 得到各自列名,添加到p1_cols和p2_cols列表中
12 for x in r[‘payload‘][‘players‘][0][‘playerProfile‘]:13p1_cols.append(x)14 for y in r[‘payload‘][‘players‘][0][‘teamProfile‘]:15p2_cols.append(y)16 p1=pd.DataFrame(columns=p1_cols) #初始化一个DataFrame p1 用来存放playerProfile下的数据
17 p2=pd.DataFrame(columns=p2_cols) #初始化一个DataFrame p1 用来存放playerProfile下的数据
18 #遍历一次得到一个球员的信息,分别添加到DataFrame数组中
19 for z inrange(num):20 player=pd.DataFrame([r[‘payload‘][‘players‘][z][‘playerProfile‘]])21 team=pd.DataFrame([r[‘payload‘][‘players‘][z][‘teamProfile‘]])22 p1=p1.append(player,ignore_index=True)23 p2=p2.append(team,ignore_index=True)24 p3=pd.merge(p1,p2,left_index=True,right_index=True) #数据合并
25 p3.to_csv(‘f://NBA//nba_player.csv‘,index=False)
只能说简单粗暴,25行代码搞定,恩,不过数据已经拿到手。
接下来查看一下
数据量不大,也可以用EXCEL来‘偷窥‘
拿到数据,总得稍微把玩一下,才对得起这堆数据,不然和撩到了步行街标准9分妹子就分手有什么区别呢?
了解下基本的数据情况
截止全明星赛前有449名现役球员
那么各球队球员数量具体是多少呢?
老詹的骑士还差个控位,湖人在为明年做准备
很想了解下NBA球员国籍‘country‘的情况
也就是说449名现役大名单球员里,有340名美国佬咯,螺旋稳
其中,
亚洲帅哥2枚,格鲁吉亚的Zaza Pachulia 和 以色列的Omri Casspi 撑场
非洲在大帝的领导下,率将领14名出征,NBA官网上28卡国籍是刚果。
欧洲55人;大洋洲8人(澳大利亚7人,新西兰1人);南美12人;还有4人,暂且未知(NBA数据库未补充)
接下来,看一下现役球员中,每一届球员的情况
98届的 Vince Carter,Paul Pierce,Dirk Nowitzki
99届的Manu Ginobili,Jason Terry,Metta World Peace
00届的Jamal Crawford,Mike Miller
01届的Tyson Chandler,Pau Gasol,Richard Jefferson,Joe Johnson,Tony Parker,Zach Randolph
02届的Matt Barnes,Mike Dunleavy,Udonis Haslem,Nene,Luis Scola
终有一天他们会离去,就像去年夏天的Tim,Bryant 和 Kevin
还是那句话,老兵不死,只是凋零。
03白金一代也只有12人在战斗了,当安东尼顶替乐福进入16/17/全明星赛时,老詹说自己不再是年龄最大的那位了,当时的你又在想啥呢?
这里我们需要再看一项数据,就是NBA现役球员的NBA平均职业生涯年龄是多少呢?
现役球员平均职业年龄为4.76年。
新生代球员配上新时代的体系及打法,NBA也是越来越好看,越来越激烈。每一位成功的球员都是为那个时代而生的。
下面,我们看一个很有意思的数据
现役NBA球员,最受欢迎的号码前5是哪几个号码呢?
只能说,666。原来5号,8号这么受欢迎。
还有,我们平时看NBA,主播评论员都是只说美国人的lastName,所以有时候一个队有几个汤普森或者约翰逊,满脸茫然
朋友,我会告诉你,共有7个约翰逊,统统来自美国。东部4个约翰逊,西部3个约翰逊。
热火VS快船比赛解说可能就是,约翰逊外线传球给约翰逊被杀出来的约翰逊抢断成功,掩耳不及迅雷之势传给快下的约翰逊,轻松扣篮得手。
那球员的位置分布怎么样呢?小球时代,自我感觉整个联盟后场球员会遥遥领先前场球员,一起来看看,果不其然。
今天就聊到这里吧
还有许多有趣的字段,有待开发。无兄弟,不篮球,期待与大伙一起为了我们兴趣,一起讨论交流,
I am a JRS,We are family ,他强任他强。
小白一枚,能力有限,做的不好的地方,尤其是逻辑与思维上的东西,需要大神们看到了多多指教和斧正buddyquan。
QQ:1749061919 小白爬虫求带
python分析出nba球员的位置_python抓取NBA现役球员基本信息数据并进行分析相关推荐
- 小猪的Python学习之旅 —— 14.项目实战:抓取豆瓣音乐Top 250数据存到Excel中
小猪的Python学习之旅 -- 14.项目实战:抓取豆瓣音乐Top 250数据存到Excel中 标签:Python 一句话概括本文: 利用Excel存储爬到的抓取豆瓣音乐Top 250数据信息,还有 ...
- python分析出nba球员的位置_Python告诉你NBA球星都喜欢在哪个位置出手?
作者 | Crossin先生 导读:NBA 2018-19 赛季已经落下帷幕,猛龙击败勇士,成为新科冠军球队.近日各队纷纷发布2019-20季前赛赛程,迎接新赛季. 我想,不如来做个 NBA 相关的数 ...
- python关键词排名_Python抓取爱站关键词排名数据
Python批量下载爱站的关键字排名数据,非常好用.直接上代码: # -*- coding: utf-8 -*- from cPAMIE import PAMIE import os from Bea ...
- python抓取网页信息_python抓取网页中的动态数据
一.概念 网页中的许多数据并不是写死在HTML中的,而是通过js动态载入的.所以也就引出了什么是动态数据的概念,动态数据在这里指的是网页中由Javascript动态生成的页面内容,是在页面加载到浏览器 ...
- 【Python 爬虫简单的JavaScript逆向实战】抓取中国电影票房的数据
开篇闲聊 最近也是看完了崔庆才爬虫52讲里面JavaScript逆向部分,里面介绍了从简单到复杂整个JavaScript逆向的方法,里面也有一些实战案例(可以练习的),跟着视频练习之后,虽然也成功了, ...
- python爬取大众点评评论_python爬虫抓取数据 小试Python——爬虫抓取大众点评上的数据 - 电脑常识 - 服务器之家...
python爬虫抓取数据 小试Python--爬虫抓取大众点评上的数据 发布时间:2017-04-07
- python爬虫搜特定内容的论文_python爬取指定微信公众号文章
python怎么抓取微信阅清晨的阳光比不上你的一缕微笑那么动人,傍晚的彩霞比不上你的一声叹息那么心疼,你的一个个举动,一句句话语都给小编带来无尽的幸福. 抓取微信公众号的文章 一.思路分析 目前所知晓 ...
- 使用Python抓取猫眼近10万条评论并分析
<一出好戏>讲述人性,使用Python抓取猫眼近10万条评论并分析,一起揭秘"这出好戏"到底如何? 黄渤首次导演的电影<一出好戏>自8月10日在全国上映,至 ...
- python 抓取解析接口数据_[干货]用python抓取摩拜单车API数据并做可视化分析(源码)...
原标题:[干货]用python抓取摩拜单车API数据并做可视化分析(源码) 在APP中能看到很多单车,但走到那里的时候,才发现车并不在那里.有些车不知道藏到了哪里:有些车或许是在高楼的后面,由于有GP ...
最新文章
- 阿里云 centos oracle安装
- python二十五:装饰器
- 如何安装Pycharm官方统计代码行插件
- Sencha Touch 打包javaScript 和 css
- 超干货 | 一线从业者实践案例大分享:To B行业如何做增长
- 在CentOS6.x下安装Compiz——桌面立方体,特效种种
- notepad++ json插件_Emmet--Web前端工具,需要安装插件在sublime里
- linux下简易搭建svnserver
- mysql新手常见问题_MySQL数据库入门-新手常见问题答疑
- java实现kotlin接口_Kotlin 接口与 Java8 新特性接口详解
- 【MySQL】011-多表查询
- Tk/Tkx滚动条的使用
- Akka默认20s超时修改配置
- RK3566和S905X3/S905X4对比哪个好?
- [机房练习赛4.7] 深意 KMP
- CUDA加速计算的基础C/C++
- android获得键盘高度,Android 获取键盘高度,显示键盘和隐藏键盘
- [ffmpeg]ffmpeg yasm not found, use --disable-yasm for a crippled build
- Android .9图片制作教程(二)
- hive增量表和全量表_你需要了解的全量表,增量表及拉链表
热门文章
- 数组长度(array.length)
- ES6转ES5 Traceur转码器
- 使用HBuilder - wap2app 打包vue写的移动端项目 禁用原生标题栏
- 一线|领英“女性职业机会”调研显示,新兴职业对于女性优势明显
- 宝宝有这些表现正不正常?我来告诉你
- jQuery中淡入效果fadeTo
- 关闭计算机休眠文件,如何对Windows系统休眠文件瘦身并释放C盘?
- java中scanner是什么意思_java中Scanner是什么?怎么用?
- 踩坑记录(21--30)
- python console作用_pycharm run in python console和直接运行