先上图:

movie.py

import requests
from lxml import etreefor page in range(10):url = "http://www.minimp4.com/movie/?page={}".format(page)r = requests.get(url)# print(r)# print(r.text)html = etree.HTML(r.text)hrefs = html.xpath('//div[@class="meta"]/h1/a/@href')# print(hrefs)for ur in hrefs:rr = requests.get(ur)hhtml = etree.HTML(rr.text)name = hhtml.xpath('//div[@class="movie-meta"]/h1/text()')print(name[0])with open('movie.txt','a',encoding='utf-8') as fp:fp.write(name[0]+'\n')

Python 爬取迷你MP4电影网,电影名称保存到本地,Requests+lxml框架相关推荐

  1. Python 爬取淘宝商品的价格并保存到本地excel文件中

    刚学Python爬虫没多久,老想着爬点什么.哈哈,刚好前段时间双11,就把淘宝爬了下. 不知道为什么,上次对淘宝进行页面读取不需要cookie就可以获取一些信息.现在需要cookie才能过去.话不多说 ...

  2. 使用Python爬取不同类别的豆瓣电影简介

    使用Python爬取不同类别的豆瓣电影简介 之前做过一点文本分类的工作,从豆瓣上爬取了不同类别的数千条电影的简介. 爬取目标 我们爬取的目标是 豆瓣影视,打开豆瓣网,随便点击一部电影,即可看到电影的介 ...

  3. python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化

    python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化 一.抓取数据 需要的库 request库 响应http请求 json库 将文本保存成json形式 pyquery 类似JQ ...

  4. Python爬取豆瓣正在上映的电影

    Python爬取豆瓣正在上映的电影 #爬取豆瓣正在上映的电影 import requests from lxml import etree #1.将目标从网站上的页面抓取下来 headers = {' ...

  5. python爬取2019年计算机就业_2019年最新Python爬取腾讯招聘网信息代码解析

    原标题:2019年最新Python爬取腾讯招聘网信息代码解析 前言 初学Python的小伙们在入门的时候感觉这门语言有很大的难度,但是他的用处是非常广泛的,在这里将通过实例代码讲解如何通过Python ...

  6. 【考公人的福利】Python爬取中公官网资料

    [考公人的福利]Python爬取中公官网资料 一.简述 二.代码 三.运行结果 一.简述 写这个代码的目的是能够高效率提取中公官网的资料,例如:申论.行测.面试热点.公安基础知识等.大家可以根据个人需 ...

  7. python爬取猫眼正在热映电影

    用python写爬虫爬取需要的数据比较容易,以Python简洁的语法和一大波成熟的库,写起来相当的快 python的版本以及使用的库 Python 3.6.4 requests lxml 这次主要是爬 ...

  8. 用python爬取公众号推送图片并保存为PPT

    文章目录 一.前言 二.开始 (一)获取推送URL链接 (二)爬取网页并提取图片保存 1.定义用于爬取推送图片的PictureSpider类 2.定义get_url_text()方法 3.定义sear ...

  9. python爬取斗图啦表情包并下载到本地

    迫于无聊,又刚好正在学习python,就来记录一篇关于python爬取图片链接下载本地的入门文章... 主要用到的模块: request 和 BeautifulSoup4 开发之前建议先看一下官方给出 ...

最新文章

  1. js字符串加密的几种方法
  2. opencv ocr字符识别_OCR深度实践系列:图像预处理
  3. javascript,继承,封装
  4. 黄冈师范计算机考研,2019年黄冈师范学院计算机基础复试自命题考试大纲
  5. 一种M2M业务的架构及实现M2M业务的方法
  6. 基于Hadoop架构下的FineBI大数据引擎技术原理
  7. mongodb的文档游标
  8. 无心剑古体诗《永恒之美》
  9. 如何用matlab分析代谢,代谢流分析工具-CellNetAnalyzer
  10. 确认!聚划算百亿补贴要向iPad 8等新品下手,这次是真的刚刚好
  11. 三种主流的Kubernetes部署方式
  12. Free DOS 1.0发布!
  13. centos 的php5.3.3 升级5.5.3
  14. linux计划任务一小时,linux,计划任务,每小时执行一次(共7篇).docx
  15. 代码修改及模型复查 12-6
  16. 基于python生成手写的笔记
  17. 更换app图标和名称
  18. 基于TCP/IP实现串口到网络的通讯转换
  19. 解决报错: You have not concluded your merge (MERGE_HEAD exists)
  20. ArcGis Engine 专题地图制图统计图表符号化(柱状图,饼状图)

热门文章

  1. 银行核心系统的清算与结算
  2. 1u服务器系统风扇,1U工控服务器机箱介绍
  3. Unity --- 角色动画的使用以及按键控制角色运动
  4. ffmpeg生成hls点播
  5. fb静态区域_FC 与 FB 与 OB 的区别,时间标记冲突与一致性检查 有详细的步骤...
  6. www.us258.com 这家主机商相当无耻,用着不到一个月给我停了,连用户名都删了。...
  7. 成都比较好的建筑设计公司有哪些?
  8. 大吉大利-今晚吃鸡-枪械
  9. JavaScript内容回顾第十天
  10. 菜鸟入门:Java语言学习