使用request简单爬虫
import requests import reurl = "http://www.acfun.tv/v/list110/index.htm?from=fixedNav" context = requests.get(url).text#print(html.text) pattern1 = re.compile('<div class="desc">(.*)</div>') #'.*'为贪婪模式,匹配到了还要然后找,匹配到不能匹配为止,根据后面的正则表达式,会进行回溯 pattern2 = re.compile('<div class="desc">(.*?)</div>') #'.*?'一旦匹配就进行下一次匹配,不会回溯 text1 = pattern1.findall(context) for text in text1: print(text) print("--" * 20) text2 = pattern2.findall(context) for text in text2: print(text)
转载于:https://www.cnblogs.com/linxingyi/p/5123094.html
使用request简单爬虫相关推荐
- python_2开发简单爬虫
2017年12月03日 16:43:01 独行侠的守望 阅读数:204 标签: python爬虫 更多 个人分类: Python 编辑 版权声明:本文为博主原创文章,转载请注明文章链接. https: ...
- Golang实现简单爬虫框架(4)——队列实现并发任务调度
前言 在上一篇文章<Golang实现简单爬虫框架(3)--简单并发版>中我们实现了一个最简单并发爬虫,调度器为每一个Request创建一个goroutine,每个goroutine往Wor ...
- python简单爬虫程序分析_[Python专题学习]-python开发简单爬虫
掌握开发轻量级爬虫,这里的案例是不需要登录的静态网页抓取.涉及爬虫简介.简单爬虫架构.URL管理器.网页下载器(urllib2).网页解析器(BeautifulSoup) 一.爬虫简介以及爬虫的技术价 ...
- Golang实现简单爬虫框架(5)——项目重构与数据存储
前言 在上一篇文章<Golang实现简单爬虫框架(4)--队列实现并发任务调度>中,我们使用用队列实现了任务调度,接下来首先对两种并发方式做一个同构,使代码统一.然后添加数据存储模块. 注 ...
- python简单实践作业_【Python】:简单爬虫作业
使用Python编写的图片爬虫作业: #coding=utf-8 import urllib import re def getPage(url): #urllib.urlopen(url[, dat ...
- pythonurllib登录微博账号_简单爬虫实现登录新浪微博(python2.7)
因为图论作业,所以要写一个爬虫,就开始学python.接触python开始,就觉得这个语言非常舒服,不需要定义变量,不需要分号,非常简洁. 下面就聊聊,我写爬虫的经历.上网搜了一下爬虫的代码,发现简单 ...
- 简单NLP分析套路(1)----语料库积累之3种简单爬虫方式应对大部分网站
目录 近期听课的思考 语料库的记录 3种爬虫 urllib.request + BeautifulSoup scrapy 与xpath 使用selenium 模拟浏览器行为 新的改变 相关链接 未完待 ...
- 实现一个go语言的简单爬虫来爬取CSDN博文(一)
http://blog.csdn.net/tyBaoErGe/article/details/50375802?hmsr=studygolang.com&utm_medium=studygol ...
- python秒懂百科视频,Python开发简单爬虫
Python开发简单爬虫 源码网址: http://download.csdn.NET/detail/hanchaobiao/9860671 一.爬虫的简介及爬虫技术价值 1.什么是爬虫: 一段自动 ...
最新文章
- JavaCollection
- Python数值计算:一 使用Pylab绘图(1)
- CTF-杂项题-伪加密
- 2011年白银机会远超黄金 四妙招帮您赚大
- (45)css面试题集锦二
- 随便选一张扑克牌_教大家怎么快速记忆扑克牌?一学就会
- python 路由转发_[转载]无线传感器网络路由协议(转)
- 想买一辆别克GL8用做家庭用车,跑长途自驾游可以吗?
- java 夏令时 容器 问题,Java夏令时有关问题
- r语言pls分析_零基础学习R语言分析GEO
- k8s部署jar包_K8S部署SpringBoot应用_都超的博客-CSDN博客_k8s springboot
- C++之找不到libboost_system.so.1.76库解决
- FFmpeg学习(3)——视频中音频文件提取
- cc2530c语言编程库,cc2530程序设计实例之CC2530 RF部分使用—实现点对点收发
- 8月24日科技联播:特斯拉回应苹果“疯狂挖人”,对方比我们有钱100倍
- 华为nova5iotg功能使用_华为nova3怎么使用OTG功能教程,华为nova3 OTG功能详解
- 信息安全技术:健康医疗数据安全指南思维导图
- 生酮咖啡是什么意思?生酮咖啡真的能减肥吗?
- 分享107个竞聘述职PPT模板,总有一款适合您
- 分解正整数 正序分解