豆瓣电影Top250数据分析
此项目是b站上一视频的学习成果,此项目主要技术就是用了python爬虫搜集数据然后用Flask框架、Echarts、WordCloud等技术实现数据可视化
视频地址:Python爬虫编程基础5天速成(2021全新合集)Python入门+数据分析_哔哩哔哩_bilibili
先展示下效果吧
爬虫的代码在上一篇介绍过,可视化分析主要用了这五个页面,那么接下来就直接整flask的核心代码咯
from flask import Flask,render_template,request import sqlite3app = Flask(__name__) datalist = [] #设为全局变量,用于存储数据和分页使用 movieScore = [] #评分 num = [] #每个评分所统计的电影数量 page=[1,2,3,4,5,6,7,8,9,10]@app.route('/') def index():return render_template('first.html') @app.route('/first') def first():return index() @app.route('/movie') def movie():if len(datalist) == 0:# print("关于电影数据库被启动了!")con = sqlite3.connect('./movieTop250.db')cur = con.cursor()sql = "select * from movie250"data = cur.execute(sql)for item in data:datalist.append(item)cur.close()con.close()page=1movies=[]#对列表进行分割for i in range(25):movies.append(datalist[i])return render_template('movie.html',movies=movies,page=page) #进行分页 @app.route('/movie/start=<int:page>') def movie2(page):movies=[]#对列表进行分割if page: #page存在first=(page-1)*25 #首页last=page*25 #尾页else : first=0 #首页last=25 #尾页for i in range(first,last):movies.append(datalist[i])#列表分割完成if page == 1:return render_template('movie.html',movies=movies,page=page)elif page == 2:return render_template('movie.html',movies=movies,page=page)elif page == 3:return render_template('movie.html',movies=movies,page=page)elif page == 4:return render_template('movie.html',movies=movies,page=page)elif page == 5:return render_template('movie.html',movies=movies,page=page)elif page == 6:return render_template('movie.html',movies=movies,page=page)elif page == 7:return render_template('movie.html',movies=movies,page=page)elif page == 8:return render_template('movie.html',movies=movies,page=page)elif page == 9:return render_template('movie.html',movies=movies,page=page)elif page == 10:return render_template('movie.html',movies=movies,page=page)else :return render_template('movie.html',movies=movies,page=page)@app.route('/score') def score():if (movieScore == [] or num == []):# print("关于评分数据库被启动了!")con = sqlite3.connect('./movieTop250.db')cur = con.cursor()sql = "select score,count(score) from movie250 group by score"data = cur.execute(sql)for item in data:#是元组类型movieScore.append(item[0])num.append(item[1])cur.close()con.close()return render_template('score.html',movieScore=movieScore,num=num) @app.route('/word') def word():return render_template('word.html') @app.route('/team') def team():return render_template('team.html') @app.route('/echarts') def echarts():return render_template('test_echarts.html')if __name__ == "__main__":app.run(debug=True)
豆瓣电影Top250数据分析相关推荐
- python pandas 豆瓣电影 top250 数据分析
python pandas 豆瓣电影 top250 数据分析 豆瓣电影top250数据分析 数据来源(豆瓣电影top250) 爬虫代码比较简单 数据较为真实,可以进行初步的数据分析 可以将前面的几篇文 ...
- 爬虫(豆瓣电影Top250数据分析)学习笔记
学习了有关python爬虫的内容,也算有所收获,写下第一篇博客来对所学进行一个总结,也算督促自己进行主动研究学习的第一步. 主要内容: 首先总结一下学习的主要内容: 从豆瓣获取数据 建立SQLite数 ...
- python爬取豆瓣电影并分析_爬取豆瓣电影top250提取电影分类进行数据分析
标签(空格分隔):python爬虫 一.爬取网页,获取需要内容 我们今天要爬取的是豆瓣电影top250 页面如下所示: 我们需要的是里面的电影分类,通过查看源代码观察可以分析出我们需要的东西.直接进入 ...
- 爬取豆瓣电影top250提取电影分类进行数据分析
标签(空格分隔):python爬虫 一.爬取网页,获取需要内容 我们今天要爬取的是豆瓣电影top250 页面如下所示: 我们需要的是里面的电影分类,通过查看源代码观察可以分析出我们需要的东西.直接进入 ...
- python 豆瓣评论数据分析_Python数据可视化分析--豆瓣电影Top250
Python数据分析–豆瓣电影Top250 利用Python爬取豆瓣电影TOP250并进行数据分析,对于众多爬虫爱好者,应该并不陌生.很多人都会以此作为第一个练手的小项目.当然这也多亏了豆瓣的包容,没 ...
- Python大数据分析实战:豆瓣电影Top250中的最佳导演是谁?
在之前写的一篇文中中,已经采用urllib和BeautifulSoup的方式抓取了豆瓣电影TOP250的导演.编剧.演员.上映时间和地区.语言.短评数.影评数.多少人想看.多少人看过等22个字段. 接 ...
- python 豆瓣电影top250_[python爬虫]豆瓣电影Top250简单数据分析绘图
一:简介 通过抓取豆瓣电影Top250的数据,分别进行了三个数据统计,分别是:上榜的电影上映的年份,该年份总共上榜的电影数量,数量为0的就没有统计了:各个国家地区出品的电影数量:250部电影的各个类型 ...
- 爬虫小小实战——豆瓣电影top250
这就是豆瓣电影top250的首页,本次小小实战就是将电影名.年代.评分以及评分人数存到csv文件中以便进行后续的数据分析. 一.基础 先贴代码及结果 import re import requests ...
- 爬虫实战2:豆瓣电影TOP250
1.豆瓣简介 豆瓣是一个社交网站,起源于2005年,该网站以书影音起家,提供关于图书.电影.音乐唱片的推荐.评价和价格比较,以及城市独特的文化生活.本篇文章将从数据分析的角度来分析豆瓣网站.分析的维度 ...
最新文章
- Android中Parcel的分析和使用
- 如何使用Eclipse内存分析工具定位内存泄露
- 在飞塔防火墙上实现IPSec ×××
- Java 性能优化实战记录(3)--JVM OOM的分析和原因追查
- MyBatis中的@Mapper注解及配套注解使用详解
- 我建议您还是不要尝试和外国人讨论文学了,您干不过的。。。还是跟他们拼数学,逻辑,编程比较合适
- AMD、CMD、CommonJS、ES6(import/export)
- adb 获取当前activity_ADB 你想找的命令都在这里
- python内置模块_三分钟读懂Python内置模块collections
- charles抓手机app的包的操作步骤
- android rfid 数据解析_基于RFID技术的标签数据完整性与安全性解析
- 利用windows 自带WiFi共享工具共享WiFi
- idea中按住ctrl+滚轮改变字体大小
- 政策利好市场需求双加持,粉笔科技双轨并进强势突围
- 微信公众平台iPhone版开始内测了
- uni.showToast(OBJECT)消息提示框
- 07 不同 vcf 注释结果转 maf
- 名帖84 米芾 小楷《九歌》
- 双功能交联剂丨Lumiprobe 磺基花青7二羧酸研究
- Datawhale 知识图谱组队学习 之 Task 4 用户输入->知识库的查询语句