爬豆瓣电影

网站分析

1 打开https://movie.douban.com,选择  【排行榜】,然后随便选择一类型,我这里选择科幻

        2 一直浏览网页,发现没有下一的标签,是下滑再加载的,可以判定使用了 ajax 请求,进行异步的加载

检查请求信息:

1.右键【检查】>【Network】

2 找url

简单实现代码

     

 1 from urllib import request
 2 import json
 3 import time
 4
 5 headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36"}
 6 # url 信息:interval_id 表示排名段  可修改  ,limit 限制20个,就是每页请求多少个
 7 url = "https://movie.douban.com/j/chart/top_list?type=17&interval_id=100%3A90&action=&start=20&limit=20"
 8
 9 rsp = request.urlopen(url)
10 data = rsp.read().decode()
11
12 data = json.loads(data)
13
14 print(data)

运行效果

优化输出格式,代码

 1 from urllib import request
 2 import json
 3
 4 url = "https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start=20&limit=20"
 5
 6 rsp = request.urlopen(url)
 7 data = rsp.read().decode()
 8
 9 data = json.loads(data)
10
11 #遍历输出每个'k'和‘v’的值
12 for item in data:
13     print("排名:", item['rank'],"\n",
14             "名称:",item['title'],"\n",
15             "类型:",item['types'],"\n",
16             "主演:",item['actors'],"\n",
17             "国家:",item['regions'],"\n",
18             "分数:",item['score'],"\n",
19             "图片:",item['cover_url'],"\n---------------")

优化效果

好了,这样的效果,看起来更顺眼了

转载于:https://www.cnblogs.com/lanyincao/p/10829239.html

python简单爬豆瓣电影排名相关推荐

  1. Python简单爬取电影磁力链接

    Python简单爬取电影磁力链接 网页的链接:http://www.ygdy8.net/html/gndy/dyzz/list_23_2.html 打开你想要的电影:http://www.ygdy8. ...

  2. python 爬取豆瓣电影排名

    python 爬取豆瓣电影排名 任务要求 获取豆瓣电影排名前250信息 打包进文件夹 代码展示 代码如下 import requests#导入requests库 import redef GetHtm ...

  3. python爬虫(一)爬取豆瓣电影排名前50名电影的信息

    python爬虫(一)爬取豆瓣电影排名前50名电影的信息 在Python爬虫中,我们可以使用beautifulsoup对网页进行解析. 我们可以使用它来爬取豆瓣电影排名前50名的电影的详细信息,例如排 ...

  4. python爬取豆瓣短评_爬取并简单分析豆瓣电影短评

    导语 利用Python爬取并简单分析豆瓣电影短评. 说起来挺逗的,去年爬豆瓣短评的时候还是可以爬个几万条数据的,昨天我还想着终于可以起个唬人的标题了,什么爬取了xxx电影的xxx万条数据. 于是昨晚写 ...

  5. 爬取豆瓣电影排名代码

    urllib.request爬取电影排名,复制以下代码可以直接执行: -- coding:utf-8 -- import urllib import urllib.request import tim ...

  6. python使用多线程进行爬豆瓣电影top250海报图片,附源码加运行结果

    使用多线程进行爬豆瓣电影top250海报图片 # -- coding: UTF-8 -- import time import requests import urllib.request from ...

  7. BeautifulSoup爬取豆瓣电影排名

    豆瓣电影排名网址:https://movie.douban.com/top250?start=0&filter= 在进去豆瓣电影排名后,打开浏览器的检查功能分析爬取页面源代码,在写请求代码之前 ...

  8. 利用正则表达式爬取豆瓣电影排名

    利用正则表达式爬取豆瓣电影排名 一/正则表达式 二/用正则表达式爬取豆瓣top250 一/正则表达式 很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求 ...

  9. 基于Python的海量豆瓣电影、数据获取、数据预处理、数据分析、可视化、大屏设计项目(含数据库)

    目录 项目介绍 研究背景 国内外研究现状分析 研究目的 研究意义 研究总体设计 网络爬虫介绍 豆瓣电影数据的采集 数据预处理 大数据分析及可视化 豆瓣影评结构化分析 大屏可视化 文本可视化 总结 每文 ...

最新文章

  1. 计算机审计 pdf,计算机审计第三章作业.pdf
  2. from name as id为啥报错
  3. 支付宝员工求问谷歌亚马逊员工:如能六点下班,学好英语就去投奔
  4. android动态创建arraylist,Android:二维ArrayList帮助
  5. 如何固化预训练模型的参数
  6. 从创建数据库到备份恢复还原详解
  7. 理解快速生成树协议(RSTP)(二)
  8. 【招聘(北京)】.NETCORE开发工程师(微服务方向)
  9. C++ 学习之旅(16)——虚函数与纯虚函数virtual
  10. matlab表示时间集合,matlab集合操作
  11. jmeter模拟登陆
  12. 随机获取一个集合(List, Set,Map)中的元素转
  13. JavaScript之jQuery
  14. 被 onnx.checker.check_model 检查出的常见错误
  15. matlab中zeta函数,黎曼zeta函数是什么,具体点
  16. ADP论文关键要点总结
  17. 手机APP应注册这些类别的商标
  18. ORCAD 原理图中的基本操作
  19. 南亚Patchwork APT组织新活动特点分析
  20. CSDN 数据访问可视化,写给CSDN 群友们用用

热门文章

  1. 人人网的系统架构 网上搜集
  2. Response.ContentType 详细列表
  3. 抓捕盗窃犯(并查集)
  4. Python使用LDAP做用户认证
  5. 2017软件工程第三次作业--效能分析
  6. conductor任务域
  7. vim--之初学轻松几步走
  8. 中文信息匮乏年代,新媒体粉墨登场
  9. 太棒了!想学英语的好好留着!
  10. python django bootstrap_导入 201901