2018年11月15号,简书迎来大变革,取消了以往的积分制度,换为去中心化的简书钻,每日发放一万简书钻。首先,简书给出了获取钻石的途径:写文点赞,与以往的阅读,评论,点赞,关注,写作都能获取积分(不同操作获取的积分不同)不一样,现在的途径更加简单和方便。其次,也说明了获取钻石的多少取决于用户的投票(钻石越多投票权重越大)。

简书每天都会公布前一天的排名,通过编写代码,获取20181115到20181126的数据,并进行分析。

爬虫

爬虫分析

简书钻的排行采用了异步加载,我们通过找包来获取数据,这里分为文章排名和用户排名,我们单独编写代码和单独存储。

文章排名代码

用户排名代码

这里除了获取排名外,还对用户是否为简书会员(这个在分析中解释)进行了判断。

数据分析

文章TOP10

首先,我们看看获取简书钻最多的前10篇文章。

文章涉及的内容,大部分都是和简书钻的分享有关,因为简书钻是最近才开始运营的,跟着这个热点走,曝光率与投票也会相应的多一些。

文章词云

10篇文章可能看到的还是比较局限,我们看看到底哪些文章更容易上榜。我们采取制作词云的方式,看看哪些关键词是最多的。

通过关键词,我们发现,可以将关键词分为两类:

###简书钻相关:
比特币
Fountain(简书合作伙伴)
Poc
社区等
干货相关
文章
笔记
导图(这个是长期霸屏用户使用的title:思维导图实战派_汪志鹏) 初步我们可以分析出:我们结合热点以及自身的行业,是比较容易上榜的(没那么简单。。。)。
用户TOP10

如果只是知道文章title规律,我们这种普通人也是很难上榜的。接下来,我们再通过上榜的用户来分析,看看规律。首先是top10。

这些用户排行靠前,大家可以看看这些用户平时的一个分析作品,学习学习。

霸屏用户

我总共爬取了12天的数据,通过代码发现,很多用户12天都上榜了,这种霸屏用户真的是羡慕嫉妒恨。

‘书院的夫子’
,

‘linwood’
,

‘那個長江’
,

‘達士通人’
,

‘我是北崖君’
,

‘简书钻首席小管家’
,

‘宿醉弥生’
,

‘乐健君’
,

‘思维导图实战派_汪志鹏’
,

‘altcoin’
,

‘淡月6688’
,

‘临湖风徐徐道来’
,

‘小尘2016’
,

‘我是四海szw’
,

‘中本葱老爷爷’
,

‘weiblock’
,

‘蒋坤元’
,

‘且行且影’
,

‘荆白’
,

‘苍天鸭’
,

‘脸谱大叔’
,

‘肆月初陆’
,

‘币圈Tesla’
,

‘无戒’
,

‘段维Tina’
,

‘紫萤石’
,

‘陈天宇123’
,

‘Jianan嘉楠’
,

‘春木sky’
,

‘梦之蓝色’
,

‘杀个程序猿祭天’
,

‘霖山’
,

‘雪球薅羊毛’
,

‘Carykive’
,

‘木木大木木’
,

‘大琦有钻’
,

‘李砍柴’
,

‘杰夫1’
,

‘写手圈’
,

‘静夜思007’
简书会员or非会员

在前文说到过,获取的钻石很大情况下取决你先拥有的简书钻,简书尊享会员就会拥有很多的简书钻,这也就导致上榜人数中,简书会员的比重占了一大部分。

总结

结合简书钻热点上榜高
你难道不考虑下简书尊享会员么?
自身的努力也很重要,坚持写作,分享干货,这就是简书。

Python玩转简书钻,简述钻是否对文章权重有影响?结果确实有!相关推荐

  1. [译] 12步轻松搞定python装饰器 - 简书

    [译] 12步轻松搞定python装饰器 - 简书 呵呵!作为一名教python的老师,我发现学生们基本上一开始很难搞定python的装饰器,也许因为装饰器确实很难懂.搞定装饰器需要你了解一些函数式编 ...

  2. selenium+python爬取简书文章

    页面加载逻辑 当你兴致勃勃地从网上学习了基本的爬虫知识后就像找个目标实践下,拥有大量文章的简书包含了大量的有价值信息,所以自然成为了你的选择目标,如果你尝试之后会发现并没有想象的那么简单,因为里面包含 ...

  3. Python爬虫获取简书的用户、文章、评论、图片等数据,并存入数据库

    Python爬虫获取简书的用户.文章.评论.图片等数据,并存入数据库 爬虫定义:网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维 ...

  4. 用 python selenium 爬简书,Python自动化领域之 Selenium WebDriver 学习第2篇

    本篇博客使用 selenium 实现对简书官网的操作. 文章目录 通过 selenium 执行 JS selenium 实现简书搜索 selenium 隐式与显式等待 selenium 采集京东图书 ...

  5. python 排序算法 简书_Python---简析八大排序算法

    前言 1 .排序的概念 排序是计算机内经常进行的一种操作,其目的是将一组"无序"的记录序列调整为"有序"的记录序列. 排序分为内部排序和外部排序. 若整个排序过 ...

  6. 简书python_用python轻松刷简书文章访问量

    作者:bigtrace 很多人大概都为自己辛辛苦苦写的文章没人看而烦恼,本文就以简书为例,通过python来轻松刷访问量. 刷访问量需要当前没有用户登录,页面每刷新一次,阅读量就会增加一次.Repla ...

  7. 简书爬ajax接口获取csrf,Python爬取简书主页信息

    主要学习如何通过抓包工具分析简书的Ajax加载,有时间再写一个Multithread proxy spider提升效率. 1. 关键点: 使用单线程爬取,未登录,爬取简书主页Ajax加载的内容.主要有 ...

  8. python工厂模式 简书_工厂

    思考题 public void printMenu() { PancakeHouseMenu pancakeHouseMenu = new PancakeHouseMenu(); ArrayList ...

  9. 简书python_使用 Python 爬取简书网的所有文章

    01 抓取目标 我们要爬取的目标是「 简书网 」. 打开简书网的首页,随手点击一篇文章进入到详情页面. 我们要爬取的数据有:作者.头像.发布时间.文章 ID 以及文章内容. 02 准备工作 在编写爬虫 ...

最新文章

  1. 网络推广——企业新站还得是专业网络推广公司来维护!
  2. 使用YouTube API V3视频的完整描述- Google YouTube API V3 - Get Video Durations
  3. matlab的四维图像数据可视化
  4. 据说有99%的人都会做错的面试题
  5. Tomcat 服务器只能存有一个正在运行的项目
  6. IoT -- (二) 物联网传感器介绍
  7. matlab中怎么表示概率,[转载]matlab中的概率函数
  8. 当别人问你自定义哪些hooks
  9. unity 随机数_Unity 雨水滴到屏幕效果
  10. 2021华为软挑赛题_思路分析——实时更新,做多少更多少(一)
  11. 计算机公共基础课网络教学平台,“计算机基础”教学中网络教学平台应用研究.doc...
  12. Flutter-防京东商城项目-修改收货地址 删除收货地址-43
  13. VoLTE SIP代码意义及流程图解
  14. 制作bt种子(非pt站私有种)
  15. JOI2014Final 飞天鼠
  16. GPA计算器雏形--
  17. 独家连载 | 深度学习“四大天王”,你知道几个?
  18. Spring Boot当中获取request的三种方式
  19. [译]如何打造以人为本的移动游戏
  20. 充电指示灯控制中SELinux权限问题

热门文章

  1. 在线代理和缓存工具(转)
  2. mysql 前沿表设计_史上最简单MySQL教程详解(基础篇)之表的维护和改造
  3. 一台电脑两种jdk_同一个电脑安装两个jdk版本
  4. 对JavaScript解析JSON格式数据的理解
  5. 兄弟mfc9140cdn无法识别_我共享了Brother打印设备。现在只能打印但无法扫描,该如何解决? .| Brother...
  6. combox高度修改 winfrom_WinForm窗体中ComboBox控件自定义高度和选项文本居中完美解决方案...
  7. html5 Canvas 绘制基本图形 从直线图形到使用路径 - 直线、矩形、路径、多边形、复杂组合图形
  8. Python编程手册系列 - 日历、日期、时间相关内建模块详解
  9. JAVA异常和基础类库
  10. mysql外键可以是空吗_带外键的表列可以为NULL吗?