python 爬取豆瓣电影排名
python 爬取豆瓣电影排名
任务要求
- 获取豆瓣电影排名前250信息
- 打包进文件夹
代码展示
代码如下
import requests#导入requests库
import redef GetHtml(url):try:RequestAddrss={'user-agent':'Mozilla/5.0'}#更改请求地址为Mozilla/5.0r=requests.get(url,headers = RequestAddrss)#获取网页源码r.raise_for_status()#捕获异常r.encoding=r.apparent_encoding#更换编码集return r.text#获得字符串形式网页源码except:return '请求错误'def GetRank(Html):#获取网页源码data_re=' <em class="">(?P<rank>.+?)</em>.+?<span class="title">(?P<title>.+?)</span>.+?\<span class="rating_num" property="v:average">(?P<score>.+?)</span>.+?\<span>(?P<count>.+?)评价</span>'data=re.compile(data_re,re.S)#re.S模式为.匹配所有字符return data.finditer(Html)def Save(rank):#获取当前源码所有电影排名,并储存在Movie_rankings.txt中for ele in rank:rank=ele.group('rank')name=ele.group('title')score=ele.group('score')number=ele.group('count')data_list=[{'rank':rank},{'name':name},{'score':score},{'number':number}]with open('Movie_rankings.txt','a',encoding='utf-8') as f:f.write('\n'+str(data_list))def main():N=0for i in range(10):#遍历所有排名页面url='https://movie.douban.com/top250?start=%s&filter='%NHtml=GetHtml(url)rank=GetRank(Html)Save(rank)N=N+25main()
运行结果
python 爬取豆瓣电影排名相关推荐
- python爬虫(一)爬取豆瓣电影排名前50名电影的信息
python爬虫(一)爬取豆瓣电影排名前50名电影的信息 在Python爬虫中,我们可以使用beautifulsoup对网页进行解析. 我们可以使用它来爬取豆瓣电影排名前50名的电影的详细信息,例如排 ...
- 利用python爬取豆瓣电影top250
利用python爬取豆瓣电影top250: 注:本内容只是作为个人学习记录 1.业务分析 进入网页https://movie.douban.com/top250 可以看见每部电影都呈现在眼前,点击电影 ...
- python爬取豆瓣电影榜单
python爬取豆瓣电影榜单 python爬取豆瓣电影榜单并保存到本地excel中,以后就不愁没片看了. 目标 确定我们想要抓取的电影的相关内容. 抓取豆瓣top250电影的排名.电影名.评价(总结很 ...
- Python爬取豆瓣电影top250的电影信息
Python爬取豆瓣电影top250的电影信息 前言 一.简介 二.实例源码展示 小结 前言 相信很多小伙伴在学习网络爬虫时,老师们会举一些实例案例讲解爬虫知识,本文介绍的就是经典爬虫实际案例–爬取豆 ...
- python爬取豆瓣电影评论_python 爬取豆瓣电影评论,并进行词云展示及出现的问题解决办法...
def getHtml(url): """获取url页面""" headers = {'User-Agent':'Mozilla/5.0 ( ...
- 源码大公开!Python爬取豆瓣电影Top250源代码,赶紧收藏!
哈喽~大家好,我是恰恰.不知道是不是有很多小伙伴跟我一样,很喜欢看电影,尤其是那种别人推荐的豆瓣高分电影,所以学Python就有一个好处,用Python爬取豆瓣电影那是分分钟的事,再也不用因为有些电影 ...
- python爬取豆瓣电影top250_Python爬虫——爬取豆瓣电影Top250代码实例
利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...
- 利用正则表达式爬取豆瓣电影排名
利用正则表达式爬取豆瓣电影排名 一/正则表达式 二/用正则表达式爬取豆瓣top250 一/正则表达式 很多不太懂正则的朋友,在遇到需要用正则校验数据时,往往是在网上去找很久,结果找来的还是不很符合要求 ...
- python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例
利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...
最新文章
- 中文输入法切换ubuntu_切换到 Linux 工作,体验暴增 100 倍!
- Windows 10 下 Anaconda3 (Python 3.8) 配置 OpenCV-4.4.0
- python不简单_Python学习并不简单!月薪过万也不易
- Amazon网站架构学习总结
- ssis导入xml_使用SSIS包将XML文档导入SQL Server表
- 【刷题记录】GCJ 2.71~2.72
- 微软开源深度学习优化库 DeepSpeed 连登 GitHub 趋势榜!
- @程序员,这份 2 万人收藏的计算机科学速成课速码!
- 477. 汉明距离总和
- nfc修改饭卡软件下载_NFC卡模拟,从此打卡刷电梯,饭卡工卡各种IC卡都用手机搞定!...
- VS2015安装破解版Visual Assist X
- 将知网格式的.caj文件转换为.pdf文件
- adb shell命令抓包
- 计算机文件搜索快捷方式,文件搜索快捷键是什么
- 【Pygame小游戏】趣味益智游戏 :打地鼠,看一下能打多少只呢?(附源码)
- rmarkdown入门
- 浙大计算机专业博士后,博士后 - 浙江大学系统医学研究中心
- 基于JSP+MySQL的网上购书商城
- 关键对话:如何高效能沟通
- VSCode创建工程文件