自从学会了爬虫的基本用法之后,一些网页上的基本信息都可以很容易的爬取下来。今天练习爬取了腾讯NBA官网上的每日赛程的比分,就是这个:

这个网站的信息同样是存储在json文件中,在其HTML静态文件中找不到。所以我们还是老方法,直接去找到那个json文件:

在使用Python工具爬取下来这一页后,再观察其中的信息。通常这种json文件的字典中有用的信息是被一些无用的信息所包围的,所以分析时我们就一层一层的输出该字典,直到发现对我们有用的信息。此json文件的开头内容如下:

可以发现,data这个key所对应的value中有今天的日期和队名,所以我们就输出data中的‘2020-03-11’所对应的value,找到其中有用的信息如下:

可以猜想,leftName和rightName对应的就是比赛双方的队名,而leftGoal和rightGoal对应的就是双方得分,而这一点也可以从上面的图片中验证。由此我们就得到了这场比赛双方的得分情况。Python代码如下:

import urllib.request
import json
#json文件的URL地址
url="https://matchweb.sports.qq.com/kbs/list?from=NBA_PC&columnId=100000&startTime=2020-03-11&endTime=2020-03-17&from=sporthp&callback=ajaxExec&_=1583909839470"
#补充请求头信息
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36','Referer': 'https://nba.stats.qq.com/schedule/'}
#获取数据
req=urllib.request.Request(url=url,headers=headers)
text=urllib.request.urlopen(req).read().decode('gbk')
#去文件开头的无用子串“ajaxExec”
text=text.strip("ajaxExec")
#去掉文件头尾的小括号
text=text[1:len(text)-1]
#加载为Python对象dic
content=json.loads(text)
#取出当前日期
date=list(content['data'].keys())[0]
print(date)
#输出当日所有比赛的比分
for i in content['data'][date]:print(i['leftName'],end='')print(" ",end='')print(i['leftGoal'],end='')print(":",end='')print(i['rightGoal'],end='')print(" ",end='')print(i['rightName'])

Python爬取NBA每日比赛比分相关推荐

  1. python爬取气象台每日天气图代码

    特别鸣谢以下更多python教程请到友情连接: 菜鸟教程https://www.piaodoo.com 初中毕业读什么技校 http://cntkd.net 茂名一技http://www.enechn ...

  2. Python爬取金山词霸每日一句,存储到MySQL中

    #!/usr/bin/env python # -*- coding: utf-8 -*- # @Time : 2018/7/3 20:25 # @Author : baoshan # @Site : ...

  3. python爬取中央气象台每日预报结果

    爬取中央气象台每日预报结果 目录 爬取中央气象台每日预报结果 1.数据网站介绍 2.python爬取代码 3.windows定时任务 1.数据网站介绍 ​ 中央气象台网站提供了1-7天的各要素预报信息 ...

  4. python爬取NBA湖人队球星的数据,并且用Excel保存

    前言 本文章教你如何爬取NBA湖人球队的球员信息 一.使用步骤 1.1引入库 import xlwt import requests import re from bs4 import Beautif ...

  5. 用python爬取NBA球队的所有比赛记录

    文章目录 本文摘要 1. 首先分析URL 2. 获取所有NBA球队的Team_id和中文名 3. 爬取所有NBA球队2018-2019赛季的详细比赛记录 4. 后记 本文摘要 目标任务:爬取 stat ...

  6. python 爬取NBA中国官网球员数据

    现在很多网站的数据都是通过Ajax动态加载的,我认为这恰恰降低了我们爬取的难度,因为我们无需考虑如何解析数据,只需要将json文件转换为字典形式,通过字典的键就可以取得我们所需要的数据. 爬取网站:N ...

  7. 用 Python 爬取分析每日票房数据

    ♚ 作者:小李子,某外企分析师,主要从事IT行业,但个人非常喜欢电影市场分析,所以经常会写一些电影领域的文章. 博客:http://blog.sina.com.cn/leonmovie 不知不觉又过了 ...

  8. python爬取erp每日业绩

    前情提示: 因工作需要,每日需要从公司ERP系统中读取各个分校的每日业绩以及往期业绩,制作业绩排名情况表(包含的指标包括各个分校的每日业绩,本月业绩,往期业绩等). 这里涉及的几个困难点是: 1,我所 ...

  9. python怎么爬取新浪微博数据中心_如何用python爬取nba数据中心的数据

    #coding=utf-8 import sys reload(sys) sys.setdefaultencoding('utf-8') import requests import time imp ...

最新文章

  1. 94.二叉树的中序遍历
  2. webpack项目代理异常解决
  3. C#编译器选项(目标平台)
  4. 机器学习的最佳学习路线原来只有四步
  5. 多个html如何套用套一个头部,Vue.js项目中管理每个页面的头部标签的两种方法...
  6. 【Linux】linux和Mac下命令vmstat
  7. const char *转wstring 方法
  8. 华为HG255D超级管理员密码
  9. SQLHelper--四种方法完整版
  10. 【教程】python递归三部曲(基于turtle实现可视化)-一、谢尔宾斯基三角形
  11. 分享一个在沪深300下获得146.56%超额收益的策略
  12. RedHat下载安装JDK的方法(方法二)
  13. 设计要用计算机吗,作为设计师 你需要这样的笔记本电脑
  14. 【电力电子】【2007.05】三相多电平逆变器的研究与分析
  15. IBM研究院院长:量子计算“大爆发”将在十年内到来
  16. python画图显示不全屏_关于matplotlib:如何使用Python最大化plt.show()窗口
  17. 数字工业 弹性安全丨Fortinet邀您齐聚OT安全峰会
  18. 自然语言处理技术的三个里程碑
  19. visualstudio 2013 mysql entityframework :实体模型无法添加,闪退
  20. 话说产品方法论——需求与用户研究

热门文章

  1. python读取xlsm文件_Python读写EXCEL文件常用方法大全
  2. 计算机网络严楠,《基于ARM的嵌入式森林防火预警系统的设计》.doc
  3. 编程实践-逻辑回归分类算法--马的疝气病症分类
  4. python模拟支付宝扫码登录_GitHub - Jaccorot/alipay_python: 支付宝 alipay python接口,支持担保交易,即时到帐和自动发货接口...
  5. Python基础之pyecharts创建可视化图表之折线图
  6. 用python代码画一幅星空
  7. 清肠化湿颗粒通过激活NLRP6信号和调节Th17/Treg平衡来改善DSS诱导的结肠炎
  8. 惠普新CEO象征性年薪仅1美元 有望获大量股权
  9. 钛碳化铝(Ti3AlC2)在实验检测领域中的应用
  10. u盘提示设备不在计算机中,电脑插入U盘时提示设备错误怎么解决