最近无聊在写python爬虫,分享一个爬去nba今天信息的python脚本,可能没写的美观,有优化的请大神指点!

➜  /test sudo vim nba.py

#!/usr/bin/python

#-*- coding:utf-8 -*-

class url:

def __init__(self,url):

self.url = url

def nba(self):

import re

import urllib2

hearders = "User-Agent","Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36"

url = "%s" %(self.url)

par = '2018-01-25.*htm\">(.*?)'

opener = urllib2.build_opener()

opener.addheaders = [hearders]

urllib2.install_opener(opener)

html = urllib2.urlopen(url).read().decode("utf-8")

data = re.findall(par,html)

print type(data)

for i in data:

print i

u = url('https://news.zhibo8.cc/nba/')

u.nba()

➜  /test sudo python nba.py

【翻译组】本赛季勇士的“死亡五小”为何统治力大减?

吉米-巴特勒晒与韦德合照:祝大哥生日快乐

‘坏篮框之树’!奥尼尔晒被自己扣碎过的篮框

杜兰特:火箭打的非常强硬 他们的变化不仅仅是CP3

安东尼27分 亚当斯21+10 雷霆大胜湖人迎3连胜

海沃德发推:很喜爱我们球队的斗志

莱昂纳德复出19+8约基奇23+9+7 马刺主场大胜掘金

铂金压哨劈扣为尼克斯续命 两队进入第二个加时

27分20板!字母哥爆发客场双杀奇才

宝刀未老!诺维茨基20分率队迎独行侠“首胜”

乔治缺阵 威少31+8+6甜瓜11+11 雷霆遭篮网逆转

库里当选全明星西部票王!将成为西部队长!

巴特勒赛后:我们需要变得谦逊 很高兴我们输球了

前瞻-开拓者vs步行者:两者相争,勇者胜

恩比德发推:美妙的一天!伟大的胜利+成为全明星

格里芬:利拉德值得入选全明星 而不是仅在讨论范围中

绝命中投!沃尔拿下赛季新高16助攻

前瞻-马刺VS步行者:五连客终遇银发魔鬼

java爬虫抓取nba_python爬取nba今天的信息相关推荐

  1. java爬虫的2种爬取方式(HTTP||Socket)简单Demo(一)

    转载自 java爬虫的2种爬取方式(HTTP||Socket)简单Demo(一) 最近在找java的小项目自己写着玩,但是找不到合适的,于是写开始学一点爬虫,自己也是感觉爬虫比较有趣.这里自己找了一个 ...

  2. java爬虫自动识别验证码_简单Java爬虫(一)爬取手机号码

    原创 野狗菌 希望你能喜欢 今天 关于本文: 本文介绍一个简单Java爬虫,获取网页源码,爬取电话号码. 本篇教程用我的博客一个测试网页演示. --野狗菌[希望你能喜欢] 测试页面: https:// ...

  3. java爬虫系列第二讲-爬取最新动作电影《海王》迅雷下载地址

    为什么80%的码农都做不了架构师?>>>    1. 目标 使用webmagic爬取动作电影列表信息 爬取电影**<海王>**详细信息[电影名称.电影迅雷下载地址列表] ...

  4. 几十行代码实现Java爬虫,结合jsoup爬取网名昵称

    原文链接:点击打开链接 crawler4j是一个开源爬虫框架(https://github.com/yasserg/crawler4j), 我们可以使用它进行爬虫.以爬取 http://www.nib ...

  5. java爬虫入门--用jsoup爬取汽车之家的新闻

    概述 使用jsoup来进行网页数据爬取.jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuer ...

  6. Java爬虫学习一一Jsoup爬取彼岸桌面分类下的图片

    最近在找工作,在这个过程中我感到很迷茫,投了很多简历,被查看的却很少,其中也有到现场去面试,结果也很不理想(╥╯^╰╥). 哈哈,跑题了,我在看之前所做的项目时,在我的收藏夹中看到了以前收藏的有关爬虫 ...

  7. JAVA爬虫-上海公交线路爬取

    最开始的数据获取也有两个思路  虽然我的数据不是这么来的 一 .http://www.zuobus.com/line-overview.php?c=2 这个网站有所有的上海的公交线路 二.百度poi ...

  8. Java 爬虫简单实现多线程爬取视频

    一 引言 什么是网络爬虫? 个人简单理解: 根据特定规则从指定web开放内容中抓取希望获取的数据,如视频,图片,小说等 官方权威解释(wiki): 网络爬虫(英语:),也叫网络蜘蛛(),是一种用来自动 ...

  9. Java爬虫——B站弹幕爬取

    如何通过B站视频AV号找到弹幕对应的xml文件号 首先爬取视频网页,将对应视频网页源码获得 就可以找到该视频的av号aid=8678034 还有弹幕序号,cid=14295428 弹幕存放位置为  h ...

最新文章

  1. 微软获 OpenAI 独家 GPT-3 模型授权,是潘多拉还是聚宝盆?
  2. mysql插入数据显示中文乱码
  3. 多字节 unicode和utf-8的转换
  4. python itchat 的使用
  5. 面试前需要准备的五个步骤
  6. CUDA编程中内存管理机制
  7. eclipse里的无参构造_构造方法及其作用
  8. IDEA下Springcloud框架搭建(一)之服务注册与发现
  9. android程序无法安装,安卓手机安装不了软件怎么办 手机无法安装软件原因和方法...
  10. 推荐好书:《电子设计从零开始》
  11. spss26没有典型相关性分析_【spss典型相关分析】数学建模__SPSS_典型相关分析
  12. 玩转星际争霸局部战斗 —— QMIX
  13. 【和ChatGPT对话】帮助新手批量提取图片文字信息到文件
  14. 关于三菱RJ71EIP91模块的配置
  15. Google Map 开发笔记——基础篇(Javascript )
  16. python中如何移动图形工作站_Schrodinger分子动力模拟与建模工作站配置推荐
  17. 基于51单片机的模拟洗衣机控制程序
  18. 计算机原理最大系统框图,计算机控制系统原理框图.docx
  19. 一文搞懂用Ultra Libraian 生成Altium Designer 元器件库的方法
  20. 全省营运船舶数据库项目开发记事

热门文章

  1. 微信接口配置信息总是配置失败
  2. 实现一个简单的文字云
  3. 如何合理的选择一台服务器?
  4. Crescendo for Mac(音乐记谱软件)
  5. Swagger与OpenAPI
  6. Altium Designer--如何走蛇形线
  7. TikTok Store 商店卖家上船 官方说明
  8. 汇编00-MASM 和 Visual Studio 2019 入门
  9. java 符号三角形_算法java实现--回溯法--符号三角形问题
  10. linux 系统 ko模块编译