想要爬取豆瓣电影Top250的电影排名、电影名和评分并写入文档吗?其实很简单。

  1. 打开Pycharm
  2. 得到豆瓣电影Top250的网址:
    https://movie.douban.com/top250?start=0&filter=
  3. 接下来是我的代码:
from urllib.request import urlopen, Request
from bs4 import BeautifulSoup
import re
for x in range(0,250,25):url=("https://movie.douban.com/top250?start="+str(x))+"&filter="header = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.102 Safari/537.36'}ret = Request(url, headers=header)html=urlopen(ret)name1s=[]bs = BeautifulSoup(html,'html.parser')numbers=bs.find_all("em",{ "class":""})names = bs.find_all("span",{"class":"title"})scores = bs.find_all("span",{"class":"rating_num"})for name in names:name = name.get_text()if name[1] !='/' :name1s.append(name)for number,name1,score in zip(numbers,name1s,scores,) :number = number.get_text()score = score.get_text()print(number,name1,score)list = [str(number)+ name1+ str(score)]sep = ','fl=open('douban.txt', 'a')fl.write(sep.join(list)+'\r\n')fl.close()

可以试试运行一下哦!

爬取“豆瓣电影Top250”的电影排名、电影名和评分并写入文档相关推荐

  1. 利用Requests库和正则表达式爬取豆瓣影评Top250

    说明 最近看了下爬虫基础,想写个博客来记录一下,一来是可以方便和我一样刚入门的小白来参考学习,二来也当做自己的笔记供自己以后查阅. 本文章是利用python3.6和Requests库(需自行安装,cm ...

  2. requests 获取div_爬虫系列第五篇 使用requests与BeautifulSoup爬取豆瓣图书Top250

    上一篇我们学习了BeautifulSoup的基本用法,本节我们使用它来爬取豆瓣图书Top250. 一.网页分析 我们爬取的网页的url是https://book.douban.com/top250?i ...

  3. Python爬虫学习之爬取豆瓣音乐Top250存入Excel表格中

    前言 目标网站:https://music.douban.com/top250 任务: 爬取豆瓣音乐Top250的歌曲名 爬取豆瓣音乐Top250的歌曲对应的表演者.发行时间和音乐流派(分别对应下图斜 ...

  4. R语言爬取豆瓣图书Top250

    新手爬虫,使用R中最简单的读取网页,然后获取所需内容所在行进行解析.下面介绍爬取豆瓣图书Top250的案例. 1.首先,我们知道网页规律为:"http://book.douban.com/t ...

  5. 使用Xpath语法爬取豆瓣读书Top250

    使用Xpath语法爬取豆瓣读书Top250(csv存取数据) 使用的软件是Spyder 网页地址:https://book.douban.com/top250?start=0 直接上代码: 建议大家从 ...

  6. 爬虫项目实操三、用scrapy框架爬取豆瓣读书Top250的书名,出版信息和评分

    安装方法:Windows:在终端输入命令:pip install scrapy:mac:在终端输入命令:pip3 install scrapy,按下enter键,再输入cd Python,就能跳转到P ...

  7. python爬虫爬取豆瓣读书Top250

    python爬虫爬取豆瓣读书Top250 话不多说,直接上代码! from urllib.request import urlopen, Request from bs4 import Beautif ...

  8. 使用python的scrapy框架简单的爬取豆瓣读书top250

    使用python的scrapy框架简单的爬取豆瓣读书top250 一.配置scrapy环境 1. 配置相应模块 如果没有配置过scrapy环境的一般需要安装lxml.PyOpenssl.Twisted ...

  9. python爬取豆瓣读书top250并保存xls(含源码)

    python爬取豆瓣读书top250并保存xls(含源码) 又是霍霍豆瓣的一天O(∩_∩)O哈哈~. 目标网站:http://book.douban.com/top250/ 全军出击!!! 首先,按下 ...

最新文章

  1. 死宅福音:乐高不怕多,智能分拣机帮你归类
  2. 50行Python代码,获取公众号全部文章
  3. golang odbc mysql_golang使用odbc链接hive
  4. priority queue
  5. 我的游戏学习日志46——游戏交互设计(2)
  6. 用 Java 实现断点续传 (HTTP)
  7. 检索数据_7_拼接列的值
  8. ThinkPHP 3.2.3 简单后台模块开发(一)常用配置
  9. JavaScript 温故知新 00
  10. ckc交易什么意思_在期货交易中,所谓的期货对冲是什么意思?
  11. The content of element type “resultMap“ must match “(constructor?,id*,result*,association*,collectio
  12. c语言圆周率小数点后500万位,圆周率小数点后500位数字是多少
  13. POI设置excel格式为文本格式
  14. 太湖之光超级计算机应用最高奖,世界最快超级计算机“神威·太湖之光”获得100多项应用成果...
  15. DataX 异构数据源离线同步
  16. 捕获iOS模拟器视频以进行App预览
  17. 基于阻抗控制的工业机器人轨迹跟踪系统 Simulink/Simscape 仿真
  18. 计算机应用专业顶岗实习计划,计算机学生顶岗实习计划(网络版)
  19. 发送飞信免费短信API
  20. 职场老司机:能走捷径,为什么不呢?

热门文章

  1. vscode按下ctrl键,点击鼠标别名跳转
  2. @Valid参数校验
  3. 分层softmax_层次softmax
  4. tomcat和servlet入门
  5. 国产数据库达梦与ORACLE的异同概述
  6. 海思系列量产硬件调试记录
  7. iOS判断身份证号码是否正确
  8. java项目 建文件夹_在Java工程下,用java代码创建文件夹
  9. 环境变量path误删了如何恢复?
  10. 迅宏超低成本双卡双待Android手机平台量产,价格低于1000元