Python 爬取迷你MP4电影网,电影名称保存到本地,Requests+lxml框架
先上图:
movie.py
import requests
from lxml import etreefor page in range(10):url = "http://www.minimp4.com/movie/?page={}".format(page)r = requests.get(url)# print(r)# print(r.text)html = etree.HTML(r.text)hrefs = html.xpath('//div[@class="meta"]/h1/a/@href')# print(hrefs)for ur in hrefs:rr = requests.get(ur)hhtml = etree.HTML(rr.text)name = hhtml.xpath('//div[@class="movie-meta"]/h1/text()')print(name[0])with open('movie.txt','a',encoding='utf-8') as fp:fp.write(name[0]+'\n')
Python 爬取迷你MP4电影网,电影名称保存到本地,Requests+lxml框架相关推荐
- Python 爬取淘宝商品的价格并保存到本地excel文件中
刚学Python爬虫没多久,老想着爬点什么.哈哈,刚好前段时间双11,就把淘宝爬了下. 不知道为什么,上次对淘宝进行页面读取不需要cookie就可以获取一些信息.现在需要cookie才能过去.话不多说 ...
- 使用Python爬取不同类别的豆瓣电影简介
使用Python爬取不同类别的豆瓣电影简介 之前做过一点文本分类的工作,从豆瓣上爬取了不同类别的数千条电影的简介. 爬取目标 我们爬取的目标是 豆瓣影视,打开豆瓣网,随便点击一部电影,即可看到电影的介 ...
- python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化
python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化 一.抓取数据 需要的库 request库 响应http请求 json库 将文本保存成json形式 pyquery 类似JQ ...
- Python爬取豆瓣正在上映的电影
Python爬取豆瓣正在上映的电影 #爬取豆瓣正在上映的电影 import requests from lxml import etree #1.将目标从网站上的页面抓取下来 headers = {' ...
- python爬取2019年计算机就业_2019年最新Python爬取腾讯招聘网信息代码解析
原标题:2019年最新Python爬取腾讯招聘网信息代码解析 前言 初学Python的小伙们在入门的时候感觉这门语言有很大的难度,但是他的用处是非常广泛的,在这里将通过实例代码讲解如何通过Python ...
- 【考公人的福利】Python爬取中公官网资料
[考公人的福利]Python爬取中公官网资料 一.简述 二.代码 三.运行结果 一.简述 写这个代码的目的是能够高效率提取中公官网的资料,例如:申论.行测.面试热点.公安基础知识等.大家可以根据个人需 ...
- python爬取猫眼正在热映电影
用python写爬虫爬取需要的数据比较容易,以Python简洁的语法和一大波成熟的库,写起来相当的快 python的版本以及使用的库 Python 3.6.4 requests lxml 这次主要是爬 ...
- 用python爬取公众号推送图片并保存为PPT
文章目录 一.前言 二.开始 (一)获取推送URL链接 (二)爬取网页并提取图片保存 1.定义用于爬取推送图片的PictureSpider类 2.定义get_url_text()方法 3.定义sear ...
- python爬取斗图啦表情包并下载到本地
迫于无聊,又刚好正在学习python,就来记录一篇关于python爬取图片链接下载本地的入门文章... 主要用到的模块: request 和 BeautifulSoup4 开发之前建议先看一下官方给出 ...
最新文章
- js字符串加密的几种方法
- opencv ocr字符识别_OCR深度实践系列:图像预处理
- javascript,继承,封装
- 黄冈师范计算机考研,2019年黄冈师范学院计算机基础复试自命题考试大纲
- 一种M2M业务的架构及实现M2M业务的方法
- 基于Hadoop架构下的FineBI大数据引擎技术原理
- mongodb的文档游标
- 无心剑古体诗《永恒之美》
- 如何用matlab分析代谢,代谢流分析工具-CellNetAnalyzer
- 确认!聚划算百亿补贴要向iPad 8等新品下手,这次是真的刚刚好
- 三种主流的Kubernetes部署方式
- Free DOS 1.0发布!
- centos 的php5.3.3 升级5.5.3
- linux计划任务一小时,linux,计划任务,每小时执行一次(共7篇).docx
- 代码修改及模型复查 12-6
- 基于python生成手写的笔记
- 更换app图标和名称
- 基于TCP/IP实现串口到网络的通讯转换
- 解决报错: You have not concluded your merge (MERGE_HEAD exists)
- ArcGis Engine 专题地图制图统计图表符号化(柱状图,饼状图)
热门文章
- 银行核心系统的清算与结算
- 1u服务器系统风扇,1U工控服务器机箱介绍
- Unity --- 角色动画的使用以及按键控制角色运动
- ffmpeg生成hls点播
- fb静态区域_FC 与 FB 与 OB 的区别,时间标记冲突与一致性检查 有详细的步骤...
- www.us258.com 这家主机商相当无耻,用着不到一个月给我停了,连用户名都删了。...
- 成都比较好的建筑设计公司有哪些?
- 大吉大利-今晚吃鸡-枪械
- JavaScript内容回顾第十天
- 菜鸟入门:Java语言学习