Python实现简单的爬虫获取某刀网的更新数据
昨天晚上无聊时,想着练习一下Python所以写了一个小爬虫获取小刀娱乐网里的更新数据
#!/usr/bin/python
# coding: utf-8import urllib.request
import re
#定义一个获取网页源码的子程序
head = "www.xiaodao.la"
def get():data = urllib.request.urlopen('http://www.xiaodao.la').read()#解码并去除无用文字str = data.decode("gbk").replace(r"font-weight:bold;","").replace(r" ","").replace(" ","").replace(" ","").replace("\r\n","").replace("#FF0000","#000000").strip()return str[str.find("好卡售"):str.find("20160303184868786878.gif")]#返回指定内容
#获取一次网页源码并赋值给str
str = get();
#print(str)#定义正则表达式
#reg = r'href="(.*?)"style="color:#000000;"title="(.*?)"target="_blank">'
reg = r'href="(.*?)"style="color:#000000;"title="(.*?)"target="_blank">(.*?)</a></div></td><tdwidth=12.5%align=rightnowrap=nowrapstyle="color:#F00;">(.*?)</td>'tmp = re.compile(reg);#创建正则表达式
list = re.findall(tmp,str);#正则表达式匹配
list = tuple(list)#转换类型print("一共匹配到%d个"%(len(list)))#输出匹配数量
#print(list)for i in range(len(list)):print("当前第%d个:"%(i+1))print("标题:%s\n地址:%s更新时间:%s\n"%(list[i][1],head + list[i][0],list[i][3]))
Python实现简单的爬虫获取某刀网的更新数据相关推荐
- 编写python爬虫 获取中华英才网全网工资数据
做数据分析 数据挖掘,第一步是获取数据,在这里,我们要分析现今全国各地各个职业的工资情况. 我们选择较为权威的'中华英才网',编写python爬虫获取该网站上的各个招聘信息说给出的工资,再取其行业工资 ...
- python爬虫简单实例-Python 利用Python编写简单网络爬虫实例3
利用Python编写简单网络爬虫实例3 by:授客 QQ:1033553122 实验环境 python版本:3.3.5(2.7下报错 实验目的 获取目标网站"http://bbs.51tes ...
- Python 实现简单的爬虫
Python 是一种跨平台的计算机程序设计语言,面向对象动态类型语言,Python是纯粹的自由软件,源代码和解释器cpython遵循 GPL(GNU General Public License)协议 ...
- 用python爬虫下载视频_使用Python编写简单网络爬虫抓取视频下载资源
我第一次接触爬虫这东西是在今年的5月份,当时写了一个博客搜索引擎,所用到的爬虫也挺智能的,起码比电影来了这个站用到的爬虫水平高多了! 回到用Python写爬虫的话题. Python一直是我主要使用的脚 ...
- Java爬虫 获取中国天气网7日天气预报
Java爬虫 获取中国天气网7日天气预报 前言 工具准备 爬取数据 获取日期和星期 获取天气描述 获取温度范围 获取风向及风力 完整代码 引用 前言 项目需要获取7日天气预报,免费好用的接口寻觅不到, ...
- [Python]获取起点小说网的更新情况
原创文章,欢迎转载.转载请注明:转载自 祥的博客 原文链接:https://blog.csdn.net/humanking7/article/details/90176191 文章目录 @[toc] ...
- 最简单的爬虫,用pandas爬取表格数据
最简单的爬虫:用Pandas爬取表格数据 大家好,我是小五
- 利用爬虫获取猫眼电影热门前100数据
利用爬虫获取猫眼电影热门前100数据 实现方法 1:访问网站,获取页面源码 2:解析页面 ,得到想要的数据 3:循环爬取多个页面 4:把数据写入本地文件 ''' 需求:爬取猫眼电影前100的电影信息 ...
- python怎么爬虫理数据_Python神技能 | 使用爬虫获取汽车之家全车型数据
最近想在工作相关的项目上做技术改进,需要全而准的车型数据,寻寻觅觅而不得,所以就只能自己动手丰衣足食,到网上获(窃)得(取)数据了. 汽车之家是大家公认的数据做的比较好的汽车网站,所以就用它吧.(感谢 ...
最新文章
- mysql定制rpm包_mysql运维管理-企业rpm包的定制
- dubbo+zookeeper坑坑坑
- Linux xds100,【图片】【吧主帖】在LINUX(ubuntu)系统下装CCSv6方法(原创)【dsp吧】_百度贴吧...
- 阿里云debian mysql_记录下在阿里云linux上安装与配置Mysql
- php长轮询阻塞,ajax长轮询时php被阻塞
- java程序员面试技术_java程序员面试应该具备的一些基本技能
- [USACO19FEB]Cow Dating——找规律
- python基础之python介绍
- 21. 总是让比较函数在等值情况下返回false
- MySQL 中删除重复数据只保留一条
- 南信大电脑开机自动连接校园网
- 立象Argox CP-2140E 打印机驱动
- 27-TCP 协议(快重传与快恢复)
- 软件测试testing
- k8s-Pod调度策略(入门攻略)
- [世界杯] 意大利 vs 法国 最后的决战
- 【Java JVM基本问题】记录面试题宝典中自己不熟悉的JVM问题
- 【自用】uni-app中使用自定义字体
- Fortran读写方式效率对比
- nVidia: Tegra K1开发杂记
热门文章
- onethink 1.0 框架升级ThinkPHP3.2.3后的问题解决
- 大数据学习之数据仓库Hive
- 百度公开课实录:巡检也可智能化操作?揭秘无人机自助巡检背后的奥秘
- Lu尼玛音乐小课堂(一):一些基本的音乐常识
- EDIUS激活停用遇这五种报错情况,该如何解决?
- 今天狠狠的学一下Java设计模式!
- 如何解决log4j打印日志出现中文乱码
- vmware15安装macOS10.14.4 Mojave(黑苹果)
- 天正如何批量导出坐标_教你学会天正CAD软件批量标注坐标的方法
- ASIHTTPRequest使用指南---翻译稿