获取豆瓣高分电影(500部)写入MySQL数据库:

我是一名python开发工程师,整理了一套python的学习资料,从基础的python脚本到web开发、爬虫、
数据分析、数据可视化、机器学习、面试真题等。想要的可以进群:688244617免费领取#-*-coding:UTF-8-*-
import requests
import json
import pymysql
from lxml import etreedef GetWriteData(url,num):conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mydata')cursor = conn.cursor()cursor.execute("DROP TABLE IF EXISTS db")  #如果db Base存在则删除cursor.execute('create table db ( id int(5) primary key, pname varchar(255), pf varchar(10) ,plnum int(10),zhpf int(10))')i = 0while i < num:html = requests.get(url + str(i))if '异常请求' in html.text:print('请求过于频繁,请稍后再试!')breaktext = json.loads(html.text[12:-1])i += 20print(i,round(i/20))for j in text:try:s = requests.get(j['url'])except:print('访问异常')else:ehtml = etree.HTML(s.text)nu = int(''.join(ehtml.xpath('//*[@id="interest_sectl"]/div[1]/div[2]/div/div[2]/a/span/text()')))zhpf=round(float(nu /10000 * 0.5)) + round(float(j['rate']) * 2)cursor.execute('INSERT INTO db(id,pname,pf,plnum,zhpf) values (%s, %s, %s ,%s,%s) ',[k,j['title'],j['rate'],nu,zhpf])cursor.rowcountconn.commit()cursor.close()conn.close()print('任务结束。')if __name__ == '__main__':url = 'https://movie.douban.com/j/search_subjects?type=movie&tag=豆瓣高分&sort=recommend&page_limit=20&page_start='print('开始获取,请稍候...')GetWriteData(url,500)  # 500为获取影片数量

matplotlib简单可视化:

import pymysql
import matplotlib.pyplot as plt
conn = pymysql.connect(host='127.0.0.1', port=3306, user='root', passwd='root', db='mydata',cursorclass = pymysql.cursors.DictCursor)
cursor = conn.cursor()
cursor.execute('select * from mydata.db order by zhpf desc;')
values = cursor.fetchall()
cursor.close()
conn.close()
namedata=[]
zhpf=[]
n=0
for i in values:if n>20:breaknamedata.append(i['pname'])zhpf.append(i['zhpf'])n+=1
plt.rcParams["font.sans-serif"]=["SimHei"]
plt.rcParams["axes.unicode_minus"]=False
plt.barh(y=namedata, width=zhpf, label='综合评分',color='steelblue', alpha=0.8, height=0.8)
for y, x in enumerate(zhpf):plt.text(x+2, y-0.4, '%s' % x, ha='center', va='bottom')
plt.xlabel("分值")
plt.ylabel("片名")
plt.legend()
plt.show()

以上就是本文的全部内容,觉得文章还不错的话不妨收藏起来慢慢看,有任何建议或看法欢迎大家在评论区分享讨论!

python获取豆瓣高分电影写入MYSQL+matplotlib简单可视化相关推荐

  1. python 网络爬虫 1.2 获取豆瓣TOP250电影的中英文名、港台名、导演、上映年份、电影分类以及评分,将数据存入文档。

    题目: 获取豆瓣TOP250电影的中英文名.港台名.导演.上映年份.电影分类以及评分,将数据存入文档. 代码: import codecs import csv import refrom reque ...

  2. 使用Python获取春节档电影影评,制作可视化词云图

    Python获取春节档电影影评,制作可视化词云图 前言 准备工作 采集数据部分 基本思路流程 代码实战 可视化词云图 代码展示 效果展示 前言 春节电影听巳月说都还可以,我不信,我觉得还是要看看看过的 ...

  3. python获取网页数据后写入mysql_HTTP协议与使用Python获取数据并写入MySQL

    一.Http协议 二.Https协议 三.使用Python获取数据 (1)urlib (2)GET请求 (3)POST请求 四.爬取豆瓣电影实战 1.思路 (1)在浏览器中输入https://movi ...

  4. python获取豆瓣电影

    打开豆瓣,点击选电影 到这里你会发现很简单,直接用xpath不久很容易获取到电影名及评分了吗.其实我们看到的页面是经js渲染过的,真正数据的网页在⬇ 当你点击加载更多时,会发现这个网址的前部分不变,0 ...

  5. python爬虫获取豆瓣TOP25电影名称和评分

    import requests import lxml.html myheaders = {"User-Agent": "Mozilla/5.0 (Windows NT ...

  6. python大规模获取豆瓣影评_Python 获取豆瓣用户电影收藏数据

    通过豆瓣API获取用户的影评信息,存入到字典中格式为 {电影名:评分} # -*- coding: utf-8 -*- ''' Created on May 19, 2012 @author: Edi ...

  7. python读取excel文件数据写入MySQL数据库(入门级)

    写入前准备 1.window电脑提前安装好MySQL 2.知道自己MySQL的密码和用户名 3.提前建好要写入的数据库和数据表 1.首先测试写入一条数据进去MySQL在尝试批量写入 1.1第一数据类型 ...

  8. python电影数据分析报告_【python数据分析实战】电影票房数据分析(二)数据可视化...

    在上一部分<[python数据分析实战]电影票房数据分析(一)数据采集> 已经获取到了2011年至今的票房数据,并保存在了mysql中. 本文将在实操中讲解如何将mysql中的数据抽取出来 ...

  9. python爬取电影评分_Python爬取豆瓣高分电影前250名

    import requests import pymysql import time import re import xlwt from lxml import etree headers = {' ...

  10. python获取并解析电影评分Top 250的电影名称、评分和电影类型,并统计分析出哪些电影类型占比居多(最终结果显示剧情类型的电影占比最多)

    一.实现目标       python编写一个简易的爬虫程序,获取电影有史以来的电影评分最高的前250部电影的名称和评分,获取的数据存储到exce文件中.之后统计分析出哪些电影类型占比居多. 二.实现 ...

最新文章

  1. 一文带你了解 FPGA
  2. opencv recipe for target 'all' failed解决
  3. Redis源码剖析(十二)有序集合跳表实现
  4. java 文件编码 查询系统_javaweb垃圾分类查询系统、ssm+mysql
  5. linux下提示libpng12-0缺失
  6. 来自reallh大的游戏编程饕餮大餐!
  7. 线性表java实现之顺序存储源码
  8. 迭代器模式C++实现
  9. 恒生电子笔试题数据库及算法整理记录
  10. g4600黑苹果efi_超详细黑苹果安装图文教程送EFI配置合集及系统
  11. python题目练习——jmu-python-分段函数数学函数
  12. 实战智能推荐系统(12)-- 标签推荐系统
  13. SwiftUI学习笔记-【列表】
  14. android适配器
  15. excel服务器 微信设置密码,如何用vba给excel工作簿批量设置添加打开密码? - EXCEL VBA - ExcelOffice【微信公众号:水星Excel】...
  16. 《结构思考力》思维导图
  17. python sklearn库 rnn_scikit-learn 逻辑回归类库使用小结
  18. AppleWWDRCA.cer证书
  19. 入职腾讯第九年,我辞职了!
  20. SMD电容极性的区分

热门文章

  1. iOS开发之主题皮肤
  2. 【寒江雪】点到直线的最短距离
  3. vue文件上传(单文件以及多文件)
  4. 萤火虫小巷2(看完了)
  5. 苹果8硬件保修服务器,iPhone手机刷机报错,很多是硬件问题
  6. PermissionError: [Errno 1] Operation not permitted: '../middle_result/df_cleaned.csv'
  7. 台式计算机进入安全模式蓝屏,电脑进入安全模式时蓝屏怎么解决
  8. BugKu-CTF(杂项misc)--YST的小游戏/easy_python
  9. MGV2000_S905L系列_线刷_通刷固件
  10. Unity3D游戏引擎最详尽基础教程