本系列是微信公众号/文章系列中数据分析的第一篇,仅作一个简单的示例展示,可供分析参考。
注:为避免其他影响,这里不放出具体公众号名称。以下为部分数据截图。

广告部分:

  1. 如何拿到微信文章相关数据,可见记一次微信公众号爬虫的经历(微信文章阅读点赞的获取)。相关数据获取可见文末联系方式
  2. 如何批量关注公众号,可见自动批量关注微信公众号(非逆向)

正文部分:

阅读数

首先,微信文章主要三个数据指标是阅读点赞和评论,其中评论又分为评论内容、评论内容点赞、评论总数。先小试牛刀随便根据阅读点赞评论数据画个图。

# coding: utf-8
import numpy as np
import os
import pandas as pd
import matplotlib.pyplot as plt
from pandas.plotting import register_matplotlib_convertersif __name__ == '__main__':fname = fname # 文件名# 读取数据df = pd.read_excel(fname, index_col=0)plt.cla() # 清空画图register_matplotlib_converters() # 时间序列画图,避免报错或warnning# 阅读、点赞、评论数随日期的变化# 处理日期格式df['date'] = pd.to_datetime(df['date'], format="%Y-%m-%d")date, read_num, like_num, comments = df['date'], df['read_num'], df['like_num'], df['comments']# 由于这里一开始拿到的是评论内容(用--分割),所以这里进行简单的处理,统计评论数comments_num = comments.apply(str).apply(lambda item: 0 if 'nan' in item else len(item.split('--')))df['comments_num'] = comments_num# 先把阅读数画一遍plt.plot(date, read_num, label='read_num')plt.xlabel('date')plt.xticks(rotation=30)plt.ylabel('number')plt.legend()plt.show()

阅读、点赞、评论数

    plt.plot(date, read_num, label='read_num')plt.plot(date, like_num, label='like_num', color='red')plt.scatter(date, comments_num, label='comments_num', color='orange')plt.xlabel('date')plt.xticks(rotation=30)plt.ylabel('number')plt.legend()plt.show()


这里评论数为方便与阅读和点赞区分,故用了散点来表示。但这里发现由于阅读数会远远大于点赞和评论数,所以点赞和评论数的趋势不是很明显。下面单独把点赞和评论画出来。

    plt.plot(date, like_num, label='like_num', color='red')plt.scatter(date, comments_num, label='comments_num', color='orange')plt.xlabel('date')plt.xticks(rotation=30)plt.ylabel('number')plt.legend()plt.show()


当然,这里还有一个方法可以做到把三个指标数据放一起对比。这里对三个数据都取log函数

    plt.plot(date, np.log(read_num), label='read_num')plt.plot(date, np.log(like_num), label='like_num', color='red')plt.scatter(date, np.log(comments_num), label='comments_num', color='orange')plt.xlabel('date')plt.xticks(rotation=30)plt.ylabel('number')plt.legend()plt.show()

小结一

经过上面几张图,有以下发现:

  1. 某篇文章的阅读数极其高,远超超出其他文章。后续可单独对其分析,或把其除去再分析
  2. 点赞和评论数据并不是正相关,且与阅读数也非绝对正相关。
  3. 大部分文章的点赞数和评论数都处于较低水平,后续可把点赞/评论高的拿出来进行二次分析
  4. 大部分文章是没有评论的

注:

  1. 公众号分是否有留言功能,该公众号是具备留言功能的
  2. 这里要处理,获取时间为2020年3月,数据中最近的文章是1月份的。所以在分析的时候降低了最近文章指标低的影响因素
  3. 这里没有区分一天发多篇文章的情况,所以在下面要进一步进行处理.

整合分析

这里对同一天/同一个月的文章进行汇总分析。当然也可以自定义改成按季度或者年份来分析

    tmp_df = df[['date', 'read_num', 'like_num', 'comments_num']]tmp_df = tmp_df.set_index(['date'])rule = 'M' # D, 'M', 'Q', 'QS'...tmp_df = tmp_df.resample(rule).sum() # 按天/月汇总date = tmp_df.indexplt.plot(date, np.log(tmp_df['read_num']), label='read_num')plt.plot(date, np.log(tmp_df['like_num']), label='like_num', color='red')plt.scatter(date, np.log(tmp_df['comments_num']), label='comments_num', color='orange')plt.xlabel('date')plt.xticks(rotation=30)plt.ylabel('number')plt.legend()plt.show()

按天分析

按月分析

头条影响

公众号在未认证的情况下,一天只能发表一次文章(但不一定只有一篇)。这里对同一天文章放置在头条的影响进行分析

    toutiao_df = df['toutiao']print(toutiao_df.value_counts())"""[Out]:2    3171    312Name: toutiao, dtype: int64"""

这里分析可以得出,该公众号在这段时间内大部分时间是同时发布两篇文章。所以可以很方便的进行对比分析。这里可以直接将上面的代码二次利用,绘图。

    tmp_df1 = df[df['toutiao'] == 1][['date', 'read_num', 'like_num', 'comments_num']]tmp_df2 = df[df['toutiao'] == 2][['date', 'read_num', 'like_num', 'comments_num']]tmp_df1 = tmp_df1.set_index(['date'])tmp_df2 = tmp_df2.set_index(['date'])rule = 'M' # D, 'M', 'Q', 'QS'...tmp_df1 = tmp_df1.resample(rule).sum() # 按天/月汇总tmp_df2 = tmp_df2.resample(rule).sum() # 按天/月汇总date1 = tmp_df1.indexdate2 = tmp_df2.indexplt.plot(date1, tmp_df1['read_num'], label='is_head')plt.plot(date2, tmp_df2['read_num'], label='no_head')plt.plot(date1, tmp_df1['like_num'], label='is_head')plt.plot(date2, tmp_df2['like_num'], label='no_head')plt.plot(date1, tmp_df1['comments_num'], label='is_head')plt.plot(date2, tmp_df2['comments_num'], label='no_head')plt.xlabel('date')plt.xticks(rotation=30)plt.ylabel('number')plt.legend()plt.show()

阅读数

点赞数

评论数

小结二

经过上面几张图,有以下发现:

  1. 该公众号文章在前期发表频率并不高,总体指标也较为稳定。能够在一些时间段内产出较高反响的文章
  2. 头条文章在各方面基本上会优于非头条文章,且大部分数据情况好的文章都来自于头条文章
  3. 大部分文章的点赞数和评论数都处于较低水平,后续可把点赞/评论高的拿出来进行二次分析

注:
4. 这里发现在最新的时间段,文章指标较低,这个可能是由于近期文章的指标增长较慢,导致结果存在偏差。可根据需求删除或过段时间二次分析。

以上就是第一次对微信文章数据的分析,下一篇会针对标题、评论等文字指标进行讨论,挖掘数据指标高的文章类型及如何产出。

微信文章数据分析一(阅读点赞评论)相关推荐

  1. 微信留言点赞python_荐微信文章数据分析一(阅读点赞评论)

    本系列是微信公众号/文章系列中数据分析的第一篇,仅作一个简单的示例展示,可供分析参考. 注:为避免其他影响,这里不放出具体公众号名称.以下为部分数据截图. 广告部分: 如何拿到微信文章相关数据,可见记 ...

  2. Android仿微信朋友圈2自定义点赞评论弹框

    最近在做类似微信朋友圈点赞评论的功能,有个点赞评论弹框交互,感觉效果很好,点击评论按钮弹框从按钮左边弹出,遇到了3个问题(弹出动画不对.弹框布局没有适配.弹出的位置显示不对),动画和布局好解决,弹出的 ...

  3. 微信文章如何增加阅读率

    写这篇文章,一方面是有太多人想做自媒体,希望我能分享经验,让他们少走弯路:另一方面,我自己需要整理一下做自媒体的关键点,以便于自己以后继续修炼.经过详细的思考和总结,列出了一些几个方面,一个自媒体若能 ...

  4. 划重点,如何提升微信文章点赞?

    微信文章的一个阅读数,代表一个人点进过这篇文章,但是无法确定是否已经看完.一个点赞,代表一个人对文章有着一定程度的认同,不一定读完文章,但至少拖到了最后,让文末的"阅读原文"提示或 ...

  5. 微信编辑器自带阅读鼓励金,让阅读更有意思!

    众所周知,市面上很多第三方平台微信编辑器主要功能就是让公众号推文排版更好看.但来逗编辑器不一样哦,来逗编辑器不仅能让公众号推文排版更美观,还自带阅读鼓励金,让阅读更有意思!简单来说就是公众号粉丝在看公 ...

  6. 微信文章可以同步到其他自媒体平台吗?怎么同步?

    现在新媒体运营小编真是忙死,每天要在多个自媒体平台发布文章,还要保证排版好看.在没有选题的情况,每天都忙的团团转.很多新媒体运营小编都在问,微信文章可以同步到其他自媒体平台吗?怎么同步? 微信文章可以 ...

  7. 微信公众号文章信息(阅读量、在看、点赞数)获取

      实现这一个功能主要用到了selenium.mitmproxy和wechatarticles,利用selenium可以实现脚本模拟浏览器访问,mitmproxy配合wechatarticles获取文 ...

  8. java 微信文章评论点赞_微信文章留言评论刷赞怎么弄?如何给微信文章

    微信文章留言评论刷赞怎么弄?如何给微信文章留言刷赞?如今微信公众号众多,每个微信公众号都会定期推送微信文章,我们可以在微信文章下面留言评论.现在有的商家还会通过微信文章留言评论点赞的活动来做宣传,导致 ...

  9. 如何获取微信文章阅读数和点赞数

    最近微博感觉热度有所下降,而微信则越来越火,随着上次改版文章阅读的公开也预示着微信将向营销行业进军.尽管与之前腾讯的说法有些不搭,但毕竟这是块肥肉,最终还是hold 不住了.   阅读数和点赞数公开后 ...

  10. PHP+fiddler抓包采集微信文章阅读数点赞数

    简介: 分析接口知道要获取文章阅读数和点赞数必须有key和uin这两个关键参数,不同公众号key不一样(据说有万能微信key,不懂怎么搞到),同一个公众号key大概半小时会过期 提交链接获取文章阅读量 ...

最新文章

  1. css左固定右自适应常用方法
  2. 小程序页面跳转传参参数值为url时参数时 会出现丢失
  3. East Central North America Region 2015
  4. AngularJS进阶学习
  5. 排序算法之---堆排序(很重要的一个结构,新手入门必备)
  6. conda指定路径_导出不带前缀变量的conda环境,该变量显示executab的本地路径
  7. Virtio-blk Performance Improvement
  8. linux 卷文件满,LVM逻辑卷容量的增减
  9. 如果没有英语,计算机,如果有一天没有电脑(英语作文)
  10. 打印机服务器启用后自动关闭,打印机print spooler服务启动后总是自动停止的解决方法(没测试)...
  11. pr如何处理音效_在pr中怎么让声音变的好听?pr怎么让说话的声音更好听?
  12. 对民办幼儿园管理的几点思考
  13. acer 4741G驱动
  14. 移动鼠标计算鼠标偏移量
  15. 河南高中学业水平计算机,河南高中学业水平考试
  16. Vistor(访问者模式)行为型
  17. 正味集团冲刺港股:年营收3.4亿杨声耀夫妇控制64%股权
  18. WPF 仿微信聊天气泡
  19. 使用matplotlib在图片上画框框
  20. 量子逻辑电路的初步探索

热门文章

  1. Unity3D开发游戏坦克大战
  2. python编程a的x次方_python平方-Python,平方
  3. Python-飞机大战(二)
  4. 卓有成效的管理者—第四章 如何发挥人的长处
  5. hdu5294Tricks Device 最大流之最小割
  6. 单片机广告灯实验总结_关于单片机的一些小实验lowbar;01点亮一个灯
  7. python 正则表达式(3.24)
  8. 【LeetCode】括号匹配问题(C语言)| 动图演示,超详细哦~
  9. 跳槽拿到最高月薪20K 我成为月薪20K的软件测试工程师是一种什么样的体验?
  10. 做善良公社项目的经历和感受——善良公社