爬去猫眼电影正字热映电影榜单的前五页:

#爬取猫眼电影正在热映前5面的所有电影
import requests
from requests import RequestException
import redef get_one_page(url):header ={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.87 Safari/537.36'}try:response = requests.get(url,headers = header)if response.status_code == 200:return response.textelse:return Noneexcept RequestException:return Nonedef main():url = 'http://maoyan.com/films?showType=1'html = get_one_page(url)return htmlif __name__ == '__main__':html = main()result = re.findall('<dd>.*?<div.*?class="movie-item".*?</div>.*?<div.*?class=.*?title="(\w+)".*?>',html,re.S)offset = '30'url = 'http://maoyan.com/films?showType=1'while True:url = url + '&offset=' + offsethtml = get_one_page(url)for item in re.findall('<dd>.*?<div.*?class="movie-item".*?</div>.*?<div.*?class=.*?title="(\w+)".*?>',html,re.S) :result.append(item)url = 'http://maoyan.com/films?showType=1'offset = str(int(offset) + 30)if int(offset) > 150:break# for item in result :#     print(item)with open('movies.txt','w+',encoding='utf-8') as f:for item in result:f.write(item)f.write('\n')

输出结果为:

侏罗纪世界2
猛虫过江
泄密者
超时空同居
厕所英雄
第七个小矮人
动物世界
超人总动员2
金蝉脱壳2
吃货宇宙
龙虾刑警
幸福马上来
深海越狱
爱情公寓
寂静之地
恐怖浴室
泡菜爱上小龙虾
完美陌生人
快乐星球之三十六号
血十三
后来的我们
阿飞正传
爵迹2
新乌龙院之笑闹江湖
狄仁杰之四大天王
监狱犬计划
魔镜奇缘2
邪不压正
生存家族
阿修罗
昨日青空
一纸婚约
巨齿鲨
凤凰城遗忘录
毛骨悚然之红衣男孩
西虹市首富
伊阿索密码
我不是药神
让我怎么相信你
时间监狱
的士速递5
因果启示录
大轰炸
一出好戏
侏罗纪世界3
昼颜
风语咒
侏罗纪世界
快把我哥带走
反贪风暴3
疯狂这一年
复仇者联盟4
墨多多谜境冒险
狂暴巨兽
给19岁的我自己
新哥斯拉
精灵王座
家
姽婳
最后一球
摩天营救
致命夺宝
镰仓物语
红海行动
我的宠物恐龙
午夜幽灵
路过未来
烛仙
细思极恐
封门笔仙
摸金校尉之九幽将军
唐人街探案2
凤皇传
神奇马戏团
金蝉脱壳
头号玩家
小偷家族
小悟空
只能活一个
阴阳师
阿凡达2
青年马克思
如影随心
青春不留白
战狼2
死侍2
出走的娜拉
武林怪兽
恋爱101度
捉妖记2
一个人的江湖
云南虫谷
巴啦啦小魔仙
地下凶猛
白雪公主之神秘爸爸
马兰花开
天佑之爱
银河护卫队3
冰海陷落
泰迪熊之玩具大战
欧洲攻略
美食大冒险之英雄烩
影
神探蒲松龄之兰若仙踪
衣柜里的冒险王
无双
惊奇队长
神秘世界历险记4
大闹东海
流浪地球
寻梦环游记
暗夜良人
嘻哈英熊
新大头儿子和小头爸爸2一日成才
护垫侠
疯狂的外星人
盯上小偷的贼
疯狂侏罗纪
西小河的夏天
羞羞的铁拳
宝贝老板
大脚印
黑豹
幕后玩家
速度与激情8
胖子行动队
银河护卫队
邹碧华
起跑线
他是一只狗
画框里的女人
光影之战
暮光巴黎
玛雅蜜蜂历险记
一生有你
古剑奇谭之流月昭明
阳台上
荒城纪
淘气大侦探
心灵救赎
我爱灰太狼
爱猫之城
小萝莉的猴神大叔
侏罗纪公园
大耳朵图图之美食狂想曲
赛尔号大电影之寻找凤凰神兽
命运速递
西游记女儿国
神秘巨星
双生
无问西东
芳华
真相漩涡
美国行动

  

转载于:https://www.cnblogs.com/ronghe/p/9197854.html

爬虫实战---爬取猫眼电影相关推荐

  1. 爬虫,爬取猫眼电影Top100的电影名与评分

    ** 爬虫,爬取猫眼电影Top100的电影名与评分 ** import requests import threading import reclass maoyan_top500(threading ...

  2. python战反爬虫:爬取猫眼电影数据 (一)(Requests, BeautifulSoup, MySQLdb,re等库)

    姓名:隋顺意 博客:Sui_da_xia 微信名:世界上的霸主 本篇文章未涉及猫眼反爬,主要介绍爬取无反爬内容,战反爬内容请去 python战反爬虫:爬取猫眼电影数据 (二)(Requests, Be ...

  3. python战反爬虫:爬取猫眼电影数据 (二)(Requests, BeautifulSoup, MySQLdb,re等库)

    姓名:隋顺意 博客:Sui_da_xia 微信名:世界上的霸主 本文主要介绍破解反爬,可以先去上一篇观看爬取无反爬内容 python战反爬虫:爬取猫眼电影数据 (一)(Requests, Beauti ...

  4. python战反爬虫:爬取猫眼电影数据 (一)

    非常荣幸邀请到 赛迪人工智能大赛(简称AI世青赛)全球总决赛银奖的获得者 隋顺意 小朋友为本公众号投稿,隋小朋友虽然小小年纪,但编程能力已经比大多数大学生强非常多了,欢迎大家关注,捧场. 姓名:隋顺意 ...

  5. 【Python爬虫】爬取猫眼电影排行榜并存放至csv文件

    在进行本节实战之前,希望您对requests库以及正则表达式有所了解. 运行平台:windows **Python版本: Python3.x ** 一.依赖库的安装 在本节实战之前,请确保已经正确安装 ...

  6. python爬虫,爬取猫眼电影1(正则表达式)

    本文用正则.xpath.beautifulsoup.css.pyquery几种不同的方式,爬取猫眼电影.只是记录过程.比较乱. 猫眼电影现在也添加了一些反爬虫机制,如果直接用requests可能会40 ...

  7. 爬虫如何爬取猫眼电影TOP榜数据

    今天爬虫代理就为大家分享一下,爬虫是如何爬取猫眼电影TOP榜数据的.主要抓取的内容有排名.图片.电影名称.主演.上映时间和评分信息.在抓取之前,我们先打开猫眼电影TOP100页面,研究分析页面,查找我 ...

  8. 【Python爬虫】爬取猫眼电影票房

    题记 本文旨在记录爬取猫眼电影国内票房榜单的过程,以及对脚本内字体文件反爬函数的说明. 环境 系统: Windows 10 Python版本: Python 3.7 爬取时间: 2019.3.19 难 ...

  9. python爬虫基础爬取猫眼电影

    爬取猫眼电影排行榜第一页 import requests from requests.exceptions import RequestException from sqlalchemy import ...

  10. Python全栈开发-Python爬虫-05 爬取猫眼电影榜单信息

    爬取猫眼电影榜单信息(翻页) 一. 获取url及headers 首先进入猫眼电影首页: 猫眼电影 之后点击菜单栏的 榜单 并在下面选择 TOP100榜 接着右击检查并刷新界面,在Network中找到4 ...

最新文章

  1. SAP SD 常用表
  2. gdb调试android
  3. 如何用java语言实现C#中的ref关键字(按引用传递参数)的效果
  4. java源码依赖分析_高德APP全链路源码依赖分析工程
  5. 最小二乘法矩阵微分偏导法证明
  6. CF908G. New Year and Original Order
  7. nssl1476-联【线段树】
  8. 角色互换:普通程序员与有理想的程序员
  9. Babelfish (关于mapstring,string的用法
  10. matlab适应度函数ga,ga程序中适应度函数fitness function向量化问题
  11. Oracle 补丁体系 及 opatch 工具 介绍
  12. 资源 | 我拿到了斯坦福、UCL、CMU、NYU的offer,关于博士申请你需要知道的一切...
  13. 万花筒写轮眼动态息屏_用了这么久的iPhone,才知道原来息屏也能录像
  14. 网络中的三张表——ARP表、MAC表、路由表
  15. 隐马尔科夫模型(二)
  16. 多变量微分方程组带事件控制的ODE45函数写法
  17. 微信小程序跳转另一个微信小程序携带参数并接收参数
  18. [转载]疯狂的程序员(1)
  19. SkyEye天目全数字实时仿真软件功能介绍
  20. sql数据库教程百度云_【推荐】零基础水彩画入门教程|零基础水彩教程百度云...

热门文章

  1. 2022年金三银四你应该去面试跳槽吗?
  2. 微信小程序 之wx.previewImage图片预览(单张图片预览)
  3. 答题系统 html源码,答题系统.html
  4. 理解什么叫管理vlan与业务VLAN,理解DTP及trunk的配置
  5. 转:我的创业梦想,一个关于照片的网站
  6. Spring MVC 学习笔记 by starscream
  7. 安天移动安全:重视用户个人信息保护,是App长效发展的关键
  8. Airtest连接夜神模拟器
  9. 百度爱番番数据分析体系的架构与实践
  10. 用计算机弹九八k的乐谱,完整版儿童歌曲简谱大全.docx