一、前言

1、项目介绍

本次用fiddler抓包移动端(ipad)微博,再用python爬虫获取老树画画微博几乎全部内容。因为老树画画发布的微博结构较为简单,几乎都是:一幅画,配上一段文字,所以在忽略转发内容后,获取画作、诗、发布时间、转发数、评论数、点赞数等内容,共计3395条数据。再用PIL库拼接图片,并用Echarts进行数据可视化。

2、老树画画

此前没听说过老树画画(刘树勇)的人,可以看看一席的视频:全程笑点不断,有很多值得思考的地方。演讲最后也播放了一些作品,可作为初步了解。
【一席】老树画画《做一个梦》
其人在幽默之外,给我的感觉就是有种难以描述的“江湖气”,这是我以前在所谓大学老师身上,乃至其他人身上蛮少看见的。

二、图片拼接

以前爬微信好友头像时,就用过PIL拼接图片,也在《爬取张佳玮138w+知乎关注者:数据可视化》里放上爬取北美帝国大厦亮灯图后,拼接制作的“ZJU 120”logo。
此次再度用PIL库拼接图片,当然前期需要筛选出好看的、格式和色调等相和谐的图,再将图片批量重命名成数字,完成后,几张成果图如下(文章开头的图亦然),还是蛮好看的:
不知道大家比较喜欢哪一张,存图的一定记得点个赞或打个赏,鼓励下哈。这里挑选的图主要是草木、蔬果的图,也是老树画画作品里占比不少的系列,另外几个系列是什么,留给大家自己去“探宝”了!

三、数据可视化

从微博主页可以了解到,截止20170805中午11点,其关注数:1130,粉丝数:1492599,微博数:3467。其中第一条微博始于2011年。
因为获取的3395条数据中,每条微博发布时间格式为:“Fri Feb 8 21:38:54 +800 2013”,需要先预处理,转换成星期、月份、日期、时间、年份等,这里直接用csv的“数据”-“分列”即可。

1、发布微博之年度情况

首先看看老树画画每年发布微博的数量情况:(2011-2017年)
由于老树画画第一条微博始于2011-07-25(最初的几条微博是关于温州动车追尾事故的,默哀三分钟),所以2011年和2017年数据并非全年情况,暂且看2012-2016年发布数量,可见逐年递减,2012年日均2.9条,2016年日均不到0.4条,而2011年日均更是高达3.6条。
那么具体每日的发布情况怎么样呢?上过GitHub的人,可能会对个人主页中的贡献图有印象,算是很好的展现全年数据的方式,不过此前没画过,网上搜了一圈也没看到可快速上手的,最后皇天不负有心人,终于在知乎上找到了:ECharts 小例子:实现日历图,正好也是用Echarts绘制calendar heatmap,完美。之后就是将日期数据按要求处理成统一格式,最终成果图如下:
不论是从颜色上,还是色块占比上,都可以直观的看出,老树画画发布微博数量和频率呈现逐年递减的趋势。其中在所有日期里,单日发布数量最高的(即色块颜色最深的一格)是:2012-10-19,共计24条(好吧上面色度条最大值20,小小bug了下,就懒得改了),到底发了什么,此处同样留个悬念。

2、发布微博之月份情况

接下来看看在这6年多里,每个月发布情况,9月份和12月份以340+条几乎并列第一,月均56条,而3月份和4月份以低于255条居于末位,月均43条。侧面反映了前三年每月发布数量还真不少,再后几年个别月份只有个位数的情况下,月均依旧超过40条。

3、发布微博之星期情况

再看一周内情况,每日的差距似乎不算太大。不作过多说明了。

4、发布微博之24小时情况

再看24小时情况。其中凌晨4点、5点无数据,2点4条,3点1条,6点3条,睡觉不水手机,水手机不睡觉。嗯。
数量最高的:12点334条,18点317条,难道老树画画喜欢在饭点吟诗作画?结合《一席》演讲里提到的一句诗:“眼前两碗米饭,心中一粒飞鸿。”结合此处数据,可以算作另类的解释了,又或许只是饭点前后掏出手机水会罢了。

5、评论、转发与点赞情况

上回对张佳玮138W+关注者数据进行处理时,最后并没有处理赞同数、收藏数、感谢数。此次爬取老树画画的微博内容,数值数据本就少,因此将评论数、转发数和点赞数绘制成相应散点图,结果如下:
从参与度来说,写评论、转发、点赞,三者的参与度应当依次降低,刷刷微博,刷刷朋友圈,看到不错的内容,反手就是一个......赞,是很方便的,而去写评论和回复相对麻烦些,当然不同人可能习惯不同。简书亦然,阅读量也许几百几千,转化成喜欢和赞同就少了很多,再是评论和打赏就更加寥寥了。
说回上图,评论数和转发数似乎可以看成和点赞数呈正相关。其中,点赞数1w+的有2条,相应的转发和评论数同样不低,找到对应时间的微博,分别为:
谈谈人性,说说孤独,骂骂傻逼,轻松破万赞。
再看图中纵坐标处附近,点赞数寥寥,但转发数1w,评论数几千,不可思议,找来一探究竟:
第一条:“一个泄露国家机密的人!”。
到图库里找出来,仔细瞅瞅!手动翻译成简体字:
“茂名市委书记罗荫国贪污十六亿被双规,接受调查时谈五点:‘一、要说我是贪官,说明官场就是贪场,凭什么专搞我?二、真叫我交代我能讲三天三夜,把广东官场翻个底朝天。三、中国不就是腐败分子提拔腐败分子,腐败分子反腐败吗?四、像我这种级别的,谁不能供出百来个?五、谁不花钱当上小科长叫他大哥。’”
(码完字,倒吸一口气,如果这篇文章挂了,一定是因为这个吧......富强民主文明和谐,护体!)
第二条:“有时心情糟糕,真想死掉拉倒。折腾半天睡去,醒来不想死了。——《有时候》系列之五”
生生死死的大哉问,睡一觉,将什么都抛诸脑后。
另外两条高赞高转发的微博:
“天色将晚,抱鱼上床。世间破事,去他个娘。”
18禁的评论,不能腌臜了咱小媳妇、大姑娘的眼睛,快走开,快走开,看什么看!
“【清明】烟雨十里春深,落花轻覆草痕。陌上青青柳色,心中念念故人。”
看时间,正是清明,看来触动了不少人的感情。

四、打油诗

“老树微博,三千诗与画”,这句话是我当初爬完数据后分享到朋友圈的,老树画画的“打油诗”,也是一大特色,微博底下几乎也是清一色回复诗的,倒是蛮奇特的“景观”。这里对文本、自然语言的处理、情感分析等等都没有涉及,后续可以继续研究下,看看这些诗里正面情感和负面情感情况如何?此处仅贴上原始获取的数据和词云:
曾写过诗,填过词,倒没怎么看过打油诗,有了这3千多少诗,嘿嘿嘿,倒是可以试试怎么把词频最高的一些词语串起来,写首什么,欢迎大家在评论里创作。━(*`∀´*)ノ亻!

五、小结

第一次用fiddler抓包移动端,发现比想象中简单,网上安装配置的文章很多,很简单的几步。移动端的爬取要比网页电脑的容易的多,但毕竟是微博,传说中反爬严格的社媒啊,在不清楚移动端情况下,直接上手爬,还是蛮怕被封ip和账号的。幸而顺利爬完。对于想获取数据的人来说,完全可以爬移动端,此次和上回爬知乎差不多,都是访问API,返回JSON数据,完全不用beautifulsoup,正则什么繁琐的提取信息,简直爱死JSON数据了。
再是用Echarts绘制calender heatmap,也是第一次,技能get。
最后是文本数据的挖掘、情感分析可以继续学习,社媒的数据处理和分析,没什么思路。
最后的最后,发张“舒服死了”的图,23333:

老树微博,三千诗与画相关推荐

  1. h5 先加载小图_萌宝学诗|读诗、画诗、唱诗,尽在小图姐姐的《九月九日忆山东兄弟》中!...

    原标题:萌宝学诗|读诗.画诗.唱诗,尽在小图姐姐的<九月九日忆山东兄弟>中! 萌 宝 <九月九日忆山东兄弟> 学 诗 萌萌的宝贝们, 欢迎来到"萌宝学诗"栏 ...

  2. 建诗筑画 文/奥斯·科特林

    建诗筑画 文/奥斯·科特林 回家路上,遇一工地大叔,深蓝色的工作服背后印四个大字"建诗筑画"--一路上我都在琢磨着这四个字. 我想这建筑和诗画,这两个字本来是不应该在着这地方出现的 ...

  3. 诗配画—泰戈尔情诗欣赏(转载)

    你已经使我永生,这样做是你的快乐. 这脆薄的杯儿,你不断地把它倒空, 又不断地以新生命来充满. 这小小的苇笛,你携带着它逾山越谷, 从笛管里吹出永新的音乐. 在你双手的不朽的按抚下,我的小小的心, 消 ...

  4. ETAS ES581.4 ETAS ES582.1我就这样,醉在西溪的诗与画里

    我就这样,醉在西溪的诗与画里 雀鸟的鸣叫,穿透晨曦,唤醒西溪的沉睡:着一袭白色长裙,扎着半松的发髻,就这样踏上一场寻觅的旅途. 行走在回忆的蜿蜒曲折里,穿过竹喧深处,越过草木葱荣,绕过一汪又一汪碧绿, ...

  5. 让学生用计算机给诗配画,全国信息技术优质课课稿《古诗配画》.doc

    全国信息技术优质课课稿<古诗配画> PAGE ? 河北省信息技术教学能力竞赛说课稿 ? 课 题:<古诗配画> 年 级: 三年级 教材版本:河北省九年义务教育小学信息技术 ? ? ...

  6. python拼图_用python的PIL库轻松拼接一百张照片

    多图预警,请在wifi下观看. 和大家分享下之前用python的第三方库PIL库进行多图拼接制作的一些漂亮的照片墙成果图. 一.微信好友头像 我不会Photoshop(PS),所有知道PIL库可以处理 ...

  7. python作者_精心整理|Python爱好者社区历史文章合集(作者篇)

    投稿请加小编微信:tspython,备注投稿 小编期待你的原创文章~让你的才华公之于众哦~ 2018年过去一半了~又到了盘点的时间~感谢长时间来各位好友的关注,我们的成长与你们的爱护是分不开的.更感谢 ...

  8. echarts 横坐标显示一个月_图表太丑怎么破,ECharts神器带你飞!

    一.前言 在本专栏或文集中,我曾多次使用ECharts绘制图表.进行可视化,也渐渐积累了30多个实例,本文对此前用过的所有图表和代码进行整理并分享,以给想绘制精美图表的人一点绵薄的帮助.其中全部实例已 ...

  9. Python爱好者社区历史文章列表(每周append更新一次)

    2月22日更新:   0.Python从零开始系列连载: Python从零开始系列连载(1)--安装环境 Python从零开始系列连载(2)--jupyter的常用操作 Python从零开始系列连载( ...

最新文章

  1. Keras卷积+池化层学习
  2. 万维网源代码正在被发明人拍卖,有人出价1800万,还在不断上涨
  3. 十大经典算法排序总结对比
  4. HoughCircles 函数
  5. 在Linux下写一个自己的命令
  6. c++类模板及参数类型的运行时判断
  7. 离线在线计算机系统,离线计算机系统
  8. CDH修改PySpark默认的Python版本
  9. android盒子没声音,TCL安卓智能电视没声音解决办法
  10. java接口继承类_Java 类和接口的继承
  11. 【Redis学习笔记】redis-trib.rb命令详解
  12. Hindsight Experience Replay(HER)技术
  13. ubuntu设置自动关机
  14. linux内存条故障,linux – 如何从MCE消息中找到故障内存模块?
  15. WIN10 系统重新安装 WIN7 系统步骤
  16. 你的水杯里,藏着影响世界的顶级工艺
  17. 如何在Windows命令行(DOS界面)中调用 编译器 来编译C/C++源程序
  18. windows安装MongoDB,Robo 3T
  19. 百慕大神秘三角神秘事件视频
  20. .bas是什么文件以及如何打开导入导出.bas文件的方法

热门文章

  1. mysql 中查询字段信息(字段注释和字段类型)
  2. 基于51单片机的智能鱼缸设计。 有原理图,程序,原文,可代做实物。 才用STC12C5A60S2,最新款国产51单片机
  3. 车品觉 : 数据十诫
  4. 钉钉应用中H5开发适配iphonex
  5. lua 连接redis集群
  6. SLAM技术学习笔记
  7. 电容器选型参数介绍总结
  8. webdriver常用方法+鼠标键盘事件+浏览器高级操作
  9. Android仿网易云鲸云音效动效
  10. 模仿网易云音乐鲸云特效动效