分析微博游戏名人数据

昨天我们爬取了微博游戏名人的信息,包括名字,关注量,粉丝量,微博量,地址和简介,今天我们就分析下它们的地址信息和简介

地址热力图

安装pyecharts

我第一次用pyecharts,所以需要先安装它,借助pyecharts库,可以对游戏名人的地址分布可视化,需要安装如下工具,想通过热力图的形式将他们的地址分布展现出来

$ sudo pip3 install pyecharts==0.5.10
$ sudo pip3 install echarts-countries-pypkg
$ sudo pip3 install echarts-china-provinces-pypkg
$ sudo pip3 install echarts-china-cities-pypkg
$ sudo pip3 install echarts-china-counties-pypkg

从数据库中提取数据

数据内容如下

address列就是地址信息,因为我对pandas比较熟悉,所以我是先将数据库中的数据提取出来,再转为DataFrame

#连接数据库
def connection_mysql():return pymysql.connect('ip','QINYUYOU','密码','homework')
#通过pandas读取数据库内容
def df_mysql(sql):return pd.read_sql(sql,connection_mysql())
def get_df(sql):return df_mysql(sql)

我们可以打印get_df(sql)返回的内容,检查是不是DataFrame数据

没问题,就是我们要的DataFrame

地址数据处理

我们需要的数据是地址和简介,先将他们提取出来看看

print(df['address'])
print(type(df['address']))


可以看到是一个Series数据类型
暂时没有问题,一切很顺利,我们需要对地址进行处理,比如上海静安区,我们需要将它改成上海,可以通过string的split()方法实现,通过空格将字符串分成一个字符串列表,返回列表的第一个元素即可

def address_string(string):return string.split()[0]#通过空格分割成字符串列表返回第一个元素

方法写好了,需要对Series中的每一个数据都调用address_string方法,可以通过pandas.apply()方法实现,
这里一定要注意:一定要用Series接收Series使用apply()方法,不然原Series是不会发生变化的

    df['address'] = df['address'].apply(address_string)print(df['address'])

打印看看结果

没问题,接下来就是统计地址的频率了

    df_address_count = df.groupby(['address'],as_index=False)['address'].agg({'cnt':'count'})print(df_address_count)

打印看看

   address  cnt
0       上海  278
1       云南    3
2       其他  115
3      内蒙古    1
4       北京  175
5       台湾    1
6       吉林    7
7       四川   39
8       天津    6
9       宁夏    1
10      安徽    9
11      山东   15
12      山西    5
13      广东  114
14      广西    4
15      新疆    1
16      江苏   43
17      江西    9
18      河北    4
19      河南    9
20      浙江   63
21      海南    2
22      海外   67
23      湖北   24
24      湖南   25
25      澳门    2
26      福建   19
27      贵州    4
28      辽宁   15
29      重庆   18
30      陕西   10
31      青海    2
32      香港    4
33     黑龙江    6

看到有两个地址不清楚,分别是‘其他’和‘海外’,我打算将他们移除

    df_address_count = df_address_count[~df_address_count['address'].isin(['其他'])]#选取‘其他'以外的数据    df_address_count = df_address_count[~df_address_count['address'].isin(['海外'])]#选取‘海外‘以外的数据’

画热力图

我们提取到了地址和频率信息,就可以做热力图了
查看pyecharts中文文档,研究画出热力图
google搜索十六进制颜色,而已获取颜色的十六进制,方便我们配置图形的参数

pyecharts中文文档

    address = df_address_count['address']#地址count = df_address_count['cnt']#频率# print(address)# print(count)geo = Geo("微博游戏名人地区热力图", "data from weibo", title_color="#161a16", title_pos="left", width=1200, height=600,background_color='#bad1ba')geo.add("微博游戏名人地区热力图", address, count, visual_range=[0, 30],type='heatmap', visual_text_color="#161a16",symbol_size=20, is_visualmap=True,is_roam=True)  # type有scatter, effectScatter, heatmap三种模式可选,可根据自己的需求选择对应的图表模式geo.render(path="微博游戏名人地区热力图.html")

运行代码生成html文件,浏览器打开

还行吧,虽然不是特别好看,起码功能实现了,后面在写简介的词云,要学的东西太多了,给自己加个油,冲鸭!!!!!!

简介词云

开始对制作简介的词云

简介数据处理

首先需要获取简介的数据

    df = get_df()df_introduction = df['introduction']print(df_introduction)

打印结果如下

得到我们要的Series,接下来我们将Series每个元素拼接成一个大的字符串即可

    string = ''for i in df_introduction:string = string + ' ' + str(i) + ' 'print(string)

结果如下

 知名游戏博主  知名游戏博主  知名游戏博主 游戏视频自媒体    上海七煌信息科技有限公司游戏解说李浩宇  知名游戏博主 游戏视频自媒体  知名游戏博主 游戏视频自媒体  王者荣耀小星工作室诚信效率为本  头条文章作者 微博签约自媒体  RNG电子竞技俱乐部ADC队员  广州上进文化传媒有限公司旗下D7G电子竞技俱乐部  知名游戏博主  英雄联盟赛事君  斗鱼直播平台签约主播 游戏视频自媒体  歌手  Newbee电子竞技俱乐部DOTA2分部队员  知名游戏博主  王者荣耀职业战队AG超玩会官方微博  知名游戏博主 游戏视频自媒体  香蕉计划签约艺人 LPL官方解说  知名游戏博主 英雄联盟超话小主持人 游戏视频自媒体  英雄联盟官方主持人 视拳签约艺人 微博vlog博主  虎牙直播签约主播 知名游戏博主 游戏视频自媒体  秒拍达人 游戏视频自媒体  穿越火线CFPL解说  游戏视频自媒体  知名游戏博主 游戏视频自媒体  微博解说视频博主 知名游戏博主  苏州游视网络科技有限公司 解说 主持人\n 知名时尚博主 时尚美妆视频自媒体  iG电子竞技俱乐部  LGD俱乐部CEO,CDEC精英联盟创始人负责人  皇族电子竞技俱乐部RNG战队 上单 Zz1tai  Snake电子竞技俱乐部打野选手  Imba传媒创始合伙人;电竞解说  DNF手游超话主持人  皇族电子竞技俱乐部RNG战队官方微博  英雄联盟官方主持人 视拳签约艺人 游戏博主  知名游戏博主 头条文章作者 微博签约自媒体  知名游戏博主  QG电子竞技俱乐部王者荣耀分部 教练  斗鱼直播主播,小象互娱合伙人,LOL前职业上单  英雄联盟官方主持人 视拳签约艺人 微博vlog博主  知名游戏博主 微博2018十大影响力游戏大V 微博签约自媒体  百度DOTA吧官方微博  知名游戏博主 头条文章作者  英雄联盟官方解说 斗鱼直播平台签约主播 《我是唱作人》百人评审  英雄联盟官方解说,LPL、LCK官方赛事解说  EDG电子竞技俱乐部官方微博  QGhappy上单位选手  王者荣耀清风代练陪练工作室  香蕉计划签约艺人 LPL官方解说 《我是唱作人》百人评审 头条文章作者  知名游戏博主  新浪游戏官方微博  知名游戏博主 游戏视频自媒体  iG电子竞技俱乐部LOL分部队员 英雄联盟S8世界赛冠军  iG电子竞技俱乐部LOL分部队员 英雄联盟S8世界赛冠军  香蕉计划签约艺人 LPL官方解说  DOTA2职业选手;DOTA第一视角解说  上海综皇文化签约解说、主持人  普通的AB站游戏实况者,各方努力中!||近期沉迷:明日方舟/Undertale/Deltrune||【合作请私信】  FPX电子竞技俱乐部英雄联盟项目中单  知名游戏博主  英雄联盟官方解说  知名游戏博主 微博2017十大V影响力新星大V 游戏视频自媒体  大电竞韩国站负责人  知名游戏博主  KPL王者荣耀官方解说 大神电竞公司艺人  虎牙直播签约主播 微博vlog博主  斗鱼签约主播 知名游戏博主 游戏视频自媒体  知名游戏博主  知名游戏博主 游戏视频自媒体  知名游戏博主 头条文章作者 微博签约自媒体  知名游戏博主  前 百度LOL贴吧吧主 知名游戏博主 英雄联盟超话粉丝大咖 游戏视频自媒体  知名游戏博主 游戏视频自媒体  DOTA殿堂级明星选手820.CN  游戏女主持,《Miss排位日记》。魔兽3、星际2 女子冠军。  虎牙直播签约主播  英雄联盟官方主持人 香蕉计划签约艺人 《我是唱作人》百人评审 知名游戏博主  知名游戏博主  Bilibili直播 签约主播  QG电子竞技俱乐部QQ飞车项目职业选手  知名游戏博主 游戏视频自媒体  知名游戏博主  GK电子竞技俱乐部特约赛训指导、虎牙直播主播  腾讯企鹅电竞签约主播 知名游戏博主  eStar电子竞技俱乐部王者荣耀分部队员  知名游戏博主  知名游戏博主 游戏视频自媒体  上海奋荣投资公司董事长 KING电子竞技及篮球俱乐部投资人  知名游戏竞技博主 头条文章作者 微博签约自媒体  微博电子竞技官方微博  工作室宗旨:诚信,负责,效率  知名游戏博主 游戏视频自媒体  QG电子竞技俱乐部王者荣耀分部 队员  知名游戏博主 和平精英超话小主持人 新鲜事金牌作者 游戏视频自媒体  虎牙直播签约主播 微博vlog博主 微博故事红人  微博剪辑视频博主 知名游戏博主 娱乐综艺视频自媒体  知名游戏博主  知名游戏博主  知名游戏博主 全民手游攻略签约作者 头条文章作者 微博签约自媒体  AG超玩会王者荣耀项目选手  知名游戏博主  None  EHOME电子竞技俱乐部DOTA2选手Cty  游戏人“多边形”  知名游戏博主 游戏视频自媒体  知名游戏博主  斗鱼TV签约主播  前 新浪看游戏人气主播;燃烧吧大脑100强 游戏视频自媒体  MarsTV主播,DOTA2官方解说  QG电子竞技俱乐部QQ飞车项目职业选手  虎牙直播签约主播  游戏解说、竞技选手,曾获得Iron Lady国际女子魔兽邀请赛冠军。 游戏视频自媒体  斗鱼签约主播 游戏视频自媒体  eStar电子竞技俱乐部王者荣耀分部队长  VG俱乐部花瓶分部现役职业选手  虎牙直播签约主播 知名游戏博主  qghappy超话小主持人  虎牙直播签约主播  快手签约主播 人气视频作者 知名游戏博主  知名游戏博主  知名游戏博主  知名游戏博主  《加油!Dota》选手  前LOL职业选手、英雄联盟最佳解说、德云色主播  全民手游攻略签约作者 头条文章作者 微博签约自媒体  优酷游戏解说 知名游戏博主  量子体育VSPN主持人/解说  微博VLOG博主  huya直播772700  微博游戏资讯博主 微博签约自媒体  知名游戏博主  NewBeeTV 运营经理 微博签约自媒体  游戏博主  新浪游戏玩家盛典王者荣耀人气王 知名游戏博主 王者荣耀超话粉丝大咖  知名游戏博主 游戏视频自媒体  知名游戏博主  游戏博主  EHOME电子竞技俱乐部官方微博  上海哔哩哔哩电竞公司 解说  AG超玩会王者荣耀项目选手  知名游戏博主  自由摄影师,《英雄联盟》AllStar等大型活动专题摄影。  虎牙直播签约主播  知名游戏博主 游戏视频自媒体  已关@,第一世界需要我拯救!  知名游戏视频制作人  知名游戏博主 王者荣耀超话小主持人 微博故事原创作者 游戏视频自媒体  游戏视频自媒体  人民体育电竞平台官方微博  上海貔卡貅文化工作室投资人  知名游戏博主  知名游戏博主  全民手游攻略签约作者 头条文章作者 微博签约自媒体  知名游戏博主  知名游戏博主  知名游戏博主 游戏视频自媒体  英雄联盟官方解说 视拳签约艺人  知名游戏博主  知名游戏博主 游戏视频自媒体 微博签约自媒体  虎牙直播签约主播  前 WE队长,中路AP,中国LOL首个世界冠军,在2012年率队连获十冠  游戏博主  斗鱼TV直播平台主播  英雄联盟官方主持人 斗鱼TV签约主播  知名游戏博主  知名游戏博主  知名游戏博主  前EDG打野选手,英雄联盟官方解说  香蕉计划签约艺人、知名游戏解说 微博vlog博主  LGD电子竞技俱乐部英雄联盟战队队长&辅助  ◇ EDG × Rookie 主剪辑 副✍												

分析微博游戏名人数据相关推荐

  1. 爬取微博游戏名人信息

    爬取微博游戏名人信息 昨天写了关于静态网站爬取爬取的文章,以为自己无所不能了,想去微博上爬点数据,差点被微博吊起来打,遇到了太多的坑了,做下记录 常规步骤 我们爬取的网址是爬取网址 我们需要爬取游戏名 ...

  2. 一键备份微博并导出生成PDF,顺便用Python分析微博账号数据!

    这里再分享下如何快速导出你的所有微博数据,然后用Python分析某个微博账号的数据,比如高赞,转发,评论微博,微博词云,微博发布时间轴,以及使用的手机. 稳部落 这是一个专业备份导出微博记录工具 ht ...

  3. 一键备份微博并导出生成PDF,顺便用Python分析微博账号数据

    苏生不惑第139 篇原创文章,将本公众号设为星标,第一时间看最新文章. 关于微博之前写过以下文章: 那些你可能不知道的微博奇技淫巧 想方便快捷的分享/收藏图片?试试免费好用的微博/b站图床 如何轻松下 ...

  4. python爬取客流数据_Python爬取南京地铁微博发布客流数据并进行分析

    Python爬取南京地铁微博发布客流数据并进行分析 之前在网上看到了分析北京地铁客流数据的开源项目,就想试着分析一下南京地铁的客流数据,可是找了很久没有找到可以获得南京地铁客流数据的接口,就去南京地铁 ...

  5. 【报告分享】2022年中国游戏产业趋势及潜力分析报告-伽马数据(附下载)

    摘要:2021年我国自主研发手机游戏海外销售市场具体销售额将提升180亿美金.而2022年仍然有可能增长速度达到二位数.从海外手机游戏市场容量和我国自研手机游戏的海外市场份额情况看来,现阶段海外销售市 ...

  6. Python爬取南京地铁微博发布客流数据并进行分析

    Python爬取南京地铁微博发布客流数据并进行分析 之前在网上看到了分析北京地铁客流数据的开源项目,就想试着分析一下南京地铁的客流数据,可是找了很久没有找到可以获得南京地铁客流数据的接口,就去南京地铁 ...

  7. 区服分析丨更透彻的游戏营运数据解读,助力高效增长

    全民买量时代,新服和新区持续增开,对玩家长线留存及付费提升显得尤为重要.在分析游戏活动效果和玩家营运数据时,相信大家都曾有过这样的疑问: 不同区服玩家的表现如何对比分析? 怎样合理评估新开区服对玩家回 ...

  8. 5-随机抓取易烊千玺置顶100万+转发微博的转发数据,并分析真假粉丝比例

    说明: 项目主要随机抓取易烊千玺100万+转发的微博置顶的100万条转发数据,并利用数据可视化的方式分析易烊千玺真假粉丝比例. 分为:爬虫+数据分析 一.爬虫[爬取易烊千玺100万条的转发数据] #爬 ...

  9. 【深度分析】游戏乐趣的一些来源

    文/青之一号 序: 在开发某网络游戏的过程中,我们团队有一个重要的理念:为用户创造激动人心的游戏乐趣. 于是,思考:乐趣是什么,从何而来?写下了一点点心得. 正文: "要养成两种习惯--治救 ...

  10. 方案详解|AARRR+八角行为分析=用游戏化思维实现用户增长

    我们需要一套基于AARRR模型,围绕增长成本.效率.质量三个话题来针对每一层转化漏斗提炼可操作的运营方案,以AARRR模型+八角行为分析法为理论框架的,游戏化运营增长策略应运而生.随着互联网线上流量的 ...

最新文章

  1. Windows 系统下设置Nodejs NPM全局路径
  2. View scrolly 正负问题
  3. oracle9i在window server 2003 sp2 企业版突破1.7G内存限制
  4. pycharm的安装与python解释器的安装,pip环境变量的配置要不然使用pip时报不是内部命令
  5. NavigationBar 渐隐效果
  6. python逐行读取数据时出现错误_python如何逐行读取数据
  7. Linux系统C/C++通用错误码实现模板
  8. java设计模式(八) 适配器模式
  9. 广西民族博物馆真好玩
  10. 教务辅助管理系统mysql_教务管理系统(项目)
  11. android 开发者模式进入
  12. 服务器位置异常饿了么,饿了么定位失败怎么办 饿了么无法定位解决办法
  13. iOS14捷径------番茄钟2.0
  14. 我的2014--菜鸟慢慢在长大
  15. 二重积分的计算 —— 交换积分顺序(exchange the order of integration)
  16. 声声入耳:音频新体验
  17. SeekBar进度条滑动调节屏幕亮度
  18. 几句话说清楚AMD® Ryzen CPU里的PBO
  19. 周易六十四卦——讼卦
  20. 2018年4月份自考总结

热门文章

  1. 最好用的木门免费录单软件
  2. 机器人动力学-牛顿-欧拉方程
  3. 图像分类网络总结回顾(上)
  4. 商品期货日内 Dual Thrust 交易策略
  5. android checkboxpreference属性,Android CheckBoxPreference Default Value
  6. 广义表存储结构图的绘制
  7. 商品规格表设计_计算机毕业设计分享jsp企业销售管理系统
  8. 云播 Android,云播放(Air Playit)android版
  9. WPF AvalonDock拖拽布局学习整理
  10. C# 设置鼠标光标为自定义图片