python爬取豆瓣排行榜电影数据(含GUI界面版)
前言
本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。
PS:如有需要Python学习资料的小伙伴可以加点击下方链接自行获取
python免费学习资料以及群交流解答点击即可加入
项目简介
这个项目源于大三某课程设计。平常经常需要搜索一些电影,但是不知道哪些评分高且评价人数多的电影。为了方便使用,就将原来的项目重新改写了。当做是对爬虫技术、可视化技术的实践了。主要是通过从排行榜和从影片关键词两种方式爬取电影数据。
配置说明
打开http://chromedriver.storage.googleapis.com/index.html,根据自己的操作系统下载对应的chromedriver
打开当前面目录下的**getMovieInRankingList.py**,定位到第59行,将executable_path=/Users/bird/Desktop/chromedriver.exe修改成你自己的chromedriver路径
打开pycharm,依次安装以下包
pip install Pillow
pip install selenium
功能截图
包含功能
根据关键字搜索电影
根据排行榜(TOP250)搜索电影
显示IMDB评分及其他基本信息
提供多个在线视频站点,无需vip
提供多个云盘站点搜索该视频,以便保存到云盘
提供多个站点下载该视频
完整代码
python爬取豆瓣排行榜电影数据(含GUI界面版)相关推荐
- 【Python实战】爬取豆瓣排行榜电影数据(含GUI界面版)
项目简介 这个项目源于大三某课程设计.平常经常需要搜索一些电影,但是不知道哪些评分高且评价人数多的电影.为了方便使用,就将原来的项目重新改写了.当做是对爬虫技术.可视化技术的实践了.主要是通过从排行榜 ...
- python爬取豆瓣排行榜电影(静态爬取)(二次爬取)
目录 python爬取豆瓣排行榜电影(静态爬取) 获取网站url 获取网站headers get请求访问url BeautifulSoup解析网站 爬取html数据 完整代码 python爬取豆瓣排行 ...
- 爬取豆瓣排行榜电影数据
进入豆瓣排行榜喜剧模块页面,我们想要获取其电影数据,首先肯定不能直接对当前url发起请求,因为这样获取的将会是整个页面数据,而不是单纯的电影数据. 经过观察发现该页面可以往下拖动页面而更新电影,所以猜 ...
- scrapy爬取豆瓣top250电影数据
scrapy爬取豆瓣top250电影数据 scrapy框架 Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架. 可以应用在包括数据挖掘,信息处理或存储历史数据等一系列的程序中. sc ...
- Python爬取豆瓣Top250电影中2000年后上映的影片信息
Python爬取豆瓣Top250电影中2000年后上映的影片信息 前言 双十一前加在京东购物车的一个东西,价格330,Plus会员用券后差不多310.双十一当天打开看了下399,还得去抢满300减10 ...
- Python爬取豆瓣Top250电影可见资料并保存为excel形式
Python爬取豆瓣Top250电影可见资料并保存为excel形式 利用requests第三方库实现网页的元素爬取,再使用openpyxl库进行信息的录入. 具体思路 1.分析网页的headers. ...
- python 爬取豆瓣top100电影页面
python 爬取豆瓣top100电影页面 运行结果截图: 代码: (原网站:https://movie.douban.com/top250) 1.将页面保存 避免多次访问 (登陆状态需页面cooki ...
- 数据分析与挖掘案例之使用python抓取豆瓣top250电影数据进行分析
使用python抓取豆瓣top250电影数据进行分析 抓取豆瓣Top250电影数据的链接和电影名称 代码如下: import urllib.request as urlrequest from bs4 ...
- python 豆瓣评论分析方法_使用python抓取豆瓣top250电影数据进行分析
抓取豆瓣Top250电影数据的链接和电影名称 代码如下: import urllib.request as urlrequest from bs4 import BeautifulSoup impor ...
最新文章
- Java的Json解析包FastJson使用
- 编译-编译原理C/C++ 静态链接库(.a) 与 动态链接库(.so)
- Activity启动模式完全解读-更新中
- 聚焦实战,架构升级!
- 每天一道LeetCode-----将字符串切分成若干单词,使得每个单词都在给定的字典中,求出所有的切分结果
- springboot 日志设计结构
- PAT甲级 -- 1041 Be Unique (20 分)
- HDU 2112 HDU Today lt;SPFA算法+map函数gt;
- MySQL常见问题的解决,root用户密码忘记,不是内部或外部命令,修改数据库和表的字符编码,命令行客户端的字符集问题
- 深度解析,教你如何打造自动驾驶的数据闭环
- Taro+react开发(41)封装组件2
- golang的指针到string,string到指针的转换
- Linux Shell编程(3)——运行shell脚本
- python基础教程菜鸟教程pdf-菜鸟教程 python pdf/Python菜鸟教程怎么样
- 常用函数的幂级数展开式
- 一个div里面包含两个div让两个div垂直居中
- java 数据可视化_8个可靠的开源数据可视化工具
- android获取摄像头视频分辨率,相机自定义拍照录像,可设置分辨率、焦距、无声录像、支持横竖屏...
- 加息 75 个基点落地,市场短暂宣泄后前路依旧黯淡?
- 腾讯云微服务引擎 TSE 11月产品动态