昨天晚上无聊时,想着练习一下Python所以写了一个小爬虫获取小刀娱乐网里的更新数据

#!/usr/bin/python
# coding: utf-8import urllib.request
import re
#定义一个获取网页源码的子程序
head = "www.xiaodao.la"
def get():data = urllib.request.urlopen('http://www.xiaodao.la').read()#解码并去除无用文字str = data.decode("gbk").replace(r"font-weight:bold;","").replace(r" ","").replace(" ","").replace(" ","").replace("\r\n","").replace("#FF0000","#000000").strip()return str[str.find("好卡售"):str.find("20160303184868786878.gif")]#返回指定内容
#获取一次网页源码并赋值给str
str = get();
#print(str)#定义正则表达式
#reg = r'href="(.*?)"style="color:#000000;"title="(.*?)"target="_blank">'
reg = r'href="(.*?)"style="color:#000000;"title="(.*?)"target="_blank">(.*?)</a></div></td><tdwidth=12.5%align=rightnowrap=nowrapstyle="color:#F00;">(.*?)</td>'tmp = re.compile(reg);#创建正则表达式
list = re.findall(tmp,str);#正则表达式匹配
list = tuple(list)#转换类型print("一共匹配到%d个"%(len(list)))#输出匹配数量
#print(list)for i in range(len(list)):print("当前第%d个:"%(i+1))print("标题:%s\n地址:%s更新时间:%s\n"%(list[i][1],head + list[i][0],list[i][3]))

Python实现简单的爬虫获取某刀网的更新数据相关推荐

  1. 编写python爬虫 获取中华英才网全网工资数据

    做数据分析 数据挖掘,第一步是获取数据,在这里,我们要分析现今全国各地各个职业的工资情况. 我们选择较为权威的'中华英才网',编写python爬虫获取该网站上的各个招聘信息说给出的工资,再取其行业工资 ...

  2. python爬虫简单实例-Python 利用Python编写简单网络爬虫实例3

    利用Python编写简单网络爬虫实例3 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站"http://bbs.51tes ...

  3. Python 实现简单的爬虫

    Python 是一种跨平台的计算机程序设计语言,面向对象动态类型语言,Python是纯粹的自由软件,源代码和解释器cpython遵循 GPL(GNU General Public License)协议 ...

  4. 用python爬虫下载视频_使用Python编写简单网络爬虫抓取视频下载资源

    我第一次接触爬虫这东西是在今年的5月份,当时写了一个博客搜索引擎,所用到的爬虫也挺智能的,起码比电影来了这个站用到的爬虫水平高多了! 回到用Python写爬虫的话题. Python一直是我主要使用的脚 ...

  5. Java爬虫 获取中国天气网7日天气预报

    Java爬虫 获取中国天气网7日天气预报 前言 工具准备 爬取数据 获取日期和星期 获取天气描述 获取温度范围 获取风向及风力 完整代码 引用 前言 项目需要获取7日天气预报,免费好用的接口寻觅不到, ...

  6. [Python]获取起点小说网的更新情况

    原创文章,欢迎转载.转载请注明:转载自 祥的博客 原文链接:https://blog.csdn.net/humanking7/article/details/90176191 文章目录 @[toc] ...

  7. 最简单的爬虫,用pandas爬取表格数据

    最简单的爬虫:用Pandas爬取表格数据 大家好,我是小五

  8. 利用爬虫获取猫眼电影热门前100数据

    利用爬虫获取猫眼电影热门前100数据 实现方法 1:访问网站,获取页面源码 2:解析页面 ,得到想要的数据 3:循环爬取多个页面 4:把数据写入本地文件 ''' 需求:爬取猫眼电影前100的电影信息 ...

  9. python怎么爬虫理数据_Python神技能 | 使用爬虫获取汽车之家全车型数据

    最近想在工作相关的项目上做技术改进,需要全而准的车型数据,寻寻觅觅而不得,所以就只能自己动手丰衣足食,到网上获(窃)得(取)数据了. 汽车之家是大家公认的数据做的比较好的汽车网站,所以就用它吧.(感谢 ...

最新文章

  1. mysql定制rpm包_mysql运维管理-企业rpm包的定制
  2. dubbo+zookeeper坑坑坑
  3. Linux xds100,【图片】【吧主帖】在LINUX(ubuntu)系统下装CCSv6方法(原创)【dsp吧】_百度贴吧...
  4. 阿里云debian mysql_记录下在阿里云linux上安装与配置Mysql
  5. php长轮询阻塞,ajax长轮询时php被阻塞
  6. java程序员面试技术_java程序员面试应该具备的一些基本技能
  7. [USACO19FEB]Cow Dating——找规律
  8. python基础之python介绍
  9. 21. 总是让比较函数在等值情况下返回false
  10. MySQL 中删除重复数据只保留一条
  11. 南信大电脑开机自动连接校园网
  12. 立象Argox CP-2140E 打印机驱动
  13. 27-TCP 协议(快重传与快恢复)
  14. 软件测试testing
  15. k8s-Pod调度策略(入门攻略)
  16. [世界杯] 意大利 vs 法国 最后的决战
  17. 【Java JVM基本问题】记录面试题宝典中自己不熟悉的JVM问题
  18. 【自用】uni-app中使用自定义字体
  19. Fortran读写方式效率对比
  20. nVidia: Tegra K1开发杂记

热门文章

  1. onethink 1.0 框架升级ThinkPHP3.2.3后的问题解决
  2. 大数据学习之数据仓库Hive
  3. 百度公开课实录:巡检也可智能化操作?揭秘无人机自助巡检背后的奥秘
  4. Lu尼玛音乐小课堂(一):一些基本的音乐常识
  5. EDIUS激活停用遇这五种报错情况,该如何解决?
  6. 今天狠狠的学一下Java设计模式!
  7. 如何解决log4j打印日志出现中文乱码
  8. vmware15安装macOS10.14.4 Mojave(黑苹果)
  9. 天正如何批量导出坐标_教你学会天正CAD软件批量标注坐标的方法
  10. ASIHTTPRequest使用指南---翻译稿