python 爬取豆瓣电影排名

任务要求
  1. 获取豆瓣电影排名前250信息
  2. 打包进文件夹
代码展示

代码如下
import requests#导入requests库
import redef GetHtml(url):try:RequestAddrss={'user-agent':'Mozilla/5.0'}#更改请求地址为Mozilla/5.0r=requests.get(url,headers = RequestAddrss)#获取网页源码r.raise_for_status()#捕获异常r.encoding=r.apparent_encoding#更换编码集return r.text#获得字符串形式网页源码except:return '请求错误'def GetRank(Html):#获取网页源码data_re=' <em class="">(?P<rank>.+?)</em>.+?<span class="title">(?P<title>.+?)</span>.+?\<span class="rating_num" property="v:average">(?P<score>.+?)</span>.+?\<span>(?P<count>.+?)评价</span>'data=re.compile(data_re,re.S)#re.S模式为.匹配所有字符return data.finditer(Html)def Save(rank):#获取当前源码所有电影排名,并储存在Movie_rankings.txt中for ele in rank:rank=ele.group('rank')name=ele.group('title')score=ele.group('score')number=ele.group('count')data_list=[{'rank':rank},{'name':name},{'score':score},{'number':number}]with open('Movie_rankings.txt','a',encoding='utf-8') as f:f.write('\n'+str(data_list))def main():N=0for i in range(10):#遍历所有排名页面url='https://movie.douban.com/top250?start=%s&filter='%NHtml=GetHtml(url)rank=GetRank(Html)Save(rank)N=N+25main()
运行结果


python 爬取豆瓣电影排名相关推荐

  1. python爬虫(一)爬取豆瓣电影排名前50名电影的信息

    python爬虫(一)爬取豆瓣电影排名前50名电影的信息 在Python爬虫中,我们可以使用beautifulsoup对网页进行解析. 我们可以使用它来爬取豆瓣电影排名前50名的电影的详细信息,例如排 ...

  2. 利用python爬取豆瓣电影top250

    利用python爬取豆瓣电影top250: 注:本内容只是作为个人学习记录 1.业务分析 进入网页https://movie.douban.com/top250 可以看见每部电影都呈现在眼前,点击电影 ...

  3. python爬取豆瓣电影榜单

    python爬取豆瓣电影榜单 python爬取豆瓣电影榜单并保存到本地excel中,以后就不愁没片看了. 目标 确定我们想要抓取的电影的相关内容. 抓取豆瓣top250电影的排名.电影名.评价(总结很 ...

  4. Python爬取豆瓣电影top250的电影信息

    Python爬取豆瓣电影top250的电影信息 前言 一.简介 二.实例源码展示 小结 前言 相信很多小伙伴在学习网络爬虫时,老师们会举一些实例案例讲解爬虫知识,本文介绍的就是经典爬虫实际案例–爬取豆 ...

  5. python爬取豆瓣电影评论_python 爬取豆瓣电影评论,并进行词云展示及出现的问题解决办法...

    def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 ( ...

  6. 源码大公开!Python爬取豆瓣电影Top250源代码,赶紧收藏!

    哈喽~大家好,我是恰恰.不知道是不是有很多小伙伴跟我一样,很喜欢看电影,尤其是那种别人推荐的豆瓣高分电影,所以学Python就有一个好处,用Python爬取豆瓣电影那是分分钟的事,再也不用因为有些电影 ...

  7. python爬取豆瓣电影top250_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  8. 利用正则表达式爬取豆瓣电影排名

    利用正则表达式爬取豆瓣电影排名 一/正则表达式 二/用正则表达式爬取豆瓣top250 一/正则表达式 很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求 ...

  9. python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

最新文章

  1. 中文输入法切换ubuntu_切换到 Linux 工作,体验暴增 100 倍!
  2. Windows 10 下 Anaconda3 (Python 3.8) 配置 OpenCV-4.4.0
  3. python不简单_Python学习并不简单!月薪过万也不易
  4. Amazon网站架构学习总结
  5. ssis导入xml_使用SSIS包将XML文档导入SQL Server表
  6. 【刷题记录】GCJ 2.71~2.72
  7. 微软开源深度学习优化库 DeepSpeed 连登 GitHub 趋势榜!
  8. @程序员,这份 2 万人收藏的计算机科学速成课速码!
  9. 477. 汉明距离总和
  10. nfc修改饭卡软件下载_NFC卡模拟,从此打卡刷电梯,饭卡工卡各种IC卡都用手机搞定!...
  11. VS2015安装破解版Visual Assist X
  12. 将知网格式的.caj文件转换为.pdf文件
  13. adb shell命令抓包
  14. 计算机文件搜索快捷方式,文件搜索快捷键是什么
  15. 【Pygame小游戏】趣味益智游戏 :打地鼠,看一下能打多少只呢?(附源码)
  16. rmarkdown入门
  17. 浙大计算机专业博士后,博士后 - 浙江大学系统医学研究中心
  18. 基于JSP+MySQL的网上购书商城
  19. 关键对话:如何高效能沟通
  20. VSCode创建工程文件

热门文章

  1. cocos lua 接入google Play 排行榜
  2. 惠普工作站Z240 WIN10系统重装WIN7 历程总结
  3. 将Sublime Text添加到鼠标右键菜单
  4. 世界上最有效率的语言
  5. Ubuntu C/C++ 获取系统时间
  6. Vuepress + GitHub Actions实现文档博客自动部署
  7. 驾照考试科目三灯光测试
  8. linux windows下oen***客户端的用法
  9. 五、框架协议——合同
  10. 51单片机入门指南-基于STC89C52(持续更新)