##读取数据
import csv
from collections import Counter'''评论时间:time评论昵称:nickName性别:gender所在城市:cityName内容:content猫眼等级:userLevel评分:score
'''time,nickName,gender,cityName,content,userLevel,score=[],[],[],[],[],[],[]
def  read_csv():content=''with  open('/home/kiosk/PycharmProjects/Scrapy/爬取猫眼评论/data.csv','r',encoding='utf-8',newline='')  as file_test:reader=csv.reader(file_test)i=0for  row  in reader:if  i!=0:time.append(row[0])nickName.append(row[1])gender.append(row[2])cityName.append(row[3])content=content+row[4]userLevel.append(row[5])score.append(row[6])#print(row)i+=1print('总共有:%s 条数据' %i )return content
read_csv()


##评论性别分布可视化:

from pyecharts import Pie, Style, Geo#from pyecharts import options  as optsdef sex_views(gender):from matplotlib import pyplot as pltlist_num = []list_num.append(gender.count(''))  ##未知list_num.append(gender.count('1'))  ##男list_num.append(gender.count('2'))  ##女attr = ['其他','男', '女']print(list_num)pie=Pie('性别分析饼图')pie.add('',attr,list_num,is_label_show=True)pie.render('/home/kiosk/PycharmProjects/Scrapy/爬取猫眼评论/sex.html')

##评论城市分布可视化:

def  city_views(cityName):city_list=list(set(cityName))city_dict={city_list[i]:0 for i  in range(len(city_list))}##计算各个城市的人数for  i  in range(len(city_list)):city_dict[city_list[i]]=cityName.count(city_list[i])##根据数量从大到小(字典的value值)排序sort_dict=sorted(city_dict.items(),key=lambda city_dict:city_dict[1],reverse=True)  ##反向排序# print(city_dict.items())# print(sort_dict)city_name=[]city_count=[]for i  in range(len(sort_dict)):city_name.append(sort_dict[i][0])city_count.append(sort_dict[i][1])from pyecharts import Barbar=Bar('城市分布图')bar.add('',city_name,city_count,is_label_show=True,is_datazoom_show=True)bar.render('/home/kiosk/PycharmProjects/Scrapy/爬取猫眼评论/city.html')

运行:

read_csv()
sex_views(gender)
city_views(cityName)


pyecharts 是一个用于生成 Echarts 图表的类库。Echarts 是百度开源的一个数据可视化 JS 库 ,将python与echarts结合的强大的数据可视化工具

(Scrapy) [kiosk@asimov ~/PycharmProjects/Scrapy]$ pip  install  pyecharts==0.5

Successfully installed dukpy-0.2.2 future-0.17.1 javascripthon-0.10 jupyter-echarts-pypkg-0.1.1 lml-0.0.2 macropy3-1.1.0b2 pillow-6.1.0 pyecharts-0.5.0 pyecharts-javascripthon-0.0.6
最新版本为1.3.0

  Bar3D(3D 柱状图) Boxplot(箱形图) EffectScatter(带有涟漪特效动画的散点图) Funnel(漏斗图) Gauge(仪表盘) Geo(地理坐标系) Graph(关系图) HeatMap(热力图) Kline(K线图) Line(折线/面积图) Line3D(3D 折线图) Liquid(水球图) Map(地图) Parallel(平行坐标系) Pie(饼图) Polar(极坐标系) Radar(雷达图) Sankey(桑基图) Scatter(散点图) Scatter3D(3D 散点图) ThemeRiver(主题河流图) WordCloud(词云图)

http://pyecharts.herokuapp.com/

爬取猫眼电影评论及数据分析(三)之数据可视化相关推荐

  1. 爬取猫眼电影影评,数据可视化分析源代码运行说明

    欢迎关注微信公众号:简说Python 账号:xksnh888 关注回复:1024,可以领取精选编程学习电子书籍. 爬取猫眼电影影评,数据可视化分析 项目地址 :github项目地址 之前一直有同学说不 ...

  2. python爬取流浪地球_Scrapy爬取猫眼流浪地球影评2----- 获取数据

    本帖最后由 py看考场 于 2019-3-25 20:16 编辑 上一篇帖子中介绍了scrapy的安装,以及scrapy的基本配置,本篇介绍流浪地球影评的获取. 上一篇帖子传输门scrapy的安装配置 ...

  3. python人人贷爬虫_爬取人人贷网上部分借贷信息以及数据可视化

    一.主题式网络爬虫设计方案:爬取人人贷网上部分借贷信息 1.主题式网络爬虫名称:爬取人人贷网上部分信息 2.主题式网络爬虫的内容与数据特征分析:爬取人人贷部分信息数据,借贷信息 3.主题式网络爬虫设计 ...

  4. 爬取拉钩网,并做一定的数据可视化

    一.爬取代码 参考:前两个是数据化参考,最后一个是爬取拉勾网参考 https://blog.csdn.net/m0_48405781/article/details/108848131?ops_req ...

  5. 爬取一周天气获取24小时温度+数据可视化

    以下代码是根据https://blog.csdn.net/weixin_45826022/article/details/109584915进行修改实现的(修改成一周温度爬取),具体的实现思路请参考上 ...

  6. 爬取猫眼《长津湖》影评,分析观影群众信息,还进行了明日票房预测,好玩!...

    对于这个十一黄金周的电影市场,绝对是<长津湖>的天下,短短几天,票房就已经突破36亿,大有奋起直追<战狼2>的尽头.而且口碑也是相当的高,猫眼评分高达9.5,绝对的票房口碑双丰 ...

  7. 爬虫实战——爬取杭电就业信息网招聘信息

    杭电宣讲会信息爬取 爬取内容: 宣讲单位,宣讲时间,所在学校,宣讲地点,单位简介等 项目需求 实现两层网页的信息爬取,并将爬取的信息进行整合保存到 excel 文件中. (1) 基础:爬取一个外层页中 ...

  8. 利用python与requests爬取猫眼上的电影数据

    @利用requests与pycharm爬取猫眼上排名前100的电影数据 首先是requests导包 源代码 import csv import reimport requests from reque ...

  9. python实战(一)Python爬取猫眼评分排行前100电影及简单数据分析可视化python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化

    python实战(一)Python爬取猫眼排行前一百电影及简单数据分析可视化 一.抓取数据 需要的库 request库 响应http请求 json库 将文本保存成json形式 pyquery 类似JQ ...

最新文章

  1. hub-spock-ospf,nbma
  2. BZOJ2115: [Wc2011] Xor
  3. stopstart按钮怎么用_烟雾报警器一直响吵人!怎么彻底给关掉?
  4. 计算机风冷散热系统的原理,显卡“发烧”的原因_显卡散热原理
  5. 注入安卓进程,并hook java世界的方法
  6. “数据中台”是什么?
  7. ConcurrentHashMap的源码分析-put方法第三阶段
  8. 卡牌大师怎么玩_用卡牌大师如何上分
  9. yolo算法的优缺点分析_yolo算法介绍
  10. 一个程序员的全部,并不是“技术”!知道为什么只能当码农吗?
  11. 深度学习笔记(12) Batch归一化网络
  12. Java eclipse汉字乱码解决
  13. endnote引用格式自定义
  14. journalctl工具基础介绍
  15. 互联网晚报 |10/12 |中国汽车出口量跃居全球第二;统一充电接口或让苹果每年损失百亿;《财富》杂志公布“改变世界的公司”榜单...
  16. pandas_计算前复权收盘价和后复权收盘价
  17. 【华为机试真题 JAVA】勾股数元组-100
  18. 深信服S5000-AC刷入 RouterOS 软路由 U盘PE下安装教程 (图文详解超详细)
  19. pmos低电平驱动_MOS管的低端驱动和高端驱动
  20. #SORA#celery研究笔记

热门文章

  1. banner设计怎么思考
  2. 低通滤波器计算截止评率_科普文|一文了解电阻-电容(RC)低通滤波器
  3. Mob 秒验 实测评
  4. Modelsim设置默认窗口排版
  5. 超爆笑段子大集锦 你要不笑我自宫
  6. 一个好用的源代码阅读工具——Understand
  7. 在PPT上使用开发工具的不同控件实现单选操作
  8. std::tr1::function and std::tr1::bind
  9. 电影动漫视频推荐网站
  10. 《水墨青花》----徐志摩