博客园积分算法探讨

今天在dudu的 《博客园FAQ》上看到了博客积分算法规则。因为同样是搞互联网的,平时工作也涉及到用户积分算法的设计,所以特把此问题拿出来分析探讨。初衷只是纯学术的研究探讨,并不构成对博客园积分机制的意见建议。

我们先来看看现行规则,用公式表示为:
-------------------------------------------------------------------
BlogScore = BeRead + 10 * BeComment + 50 * Comment

BlogScore:博客积分
BeRead:个人博客所有随笔和文章的阅读数之和
BeComment:个人博客被评论总数
Comment: 个人所发表的评论总数
-------------------------------------------------------------------
我从这个公式看出了几个问题:
1.发表随笔和文章本身不会为博客带来积分,但不发表文章,BeRead和BeCommented将永远为0
2.发表一篇评论可以直接加50分
3.被阅读10次等于被评论一次的积分

首页问题
这里,首先联想到是讨论已久的“首页问题”,上首页对文章有什么直接的好处呢?通常首页文章的BeRead值会比较大,一般1000左右。值得注意的是不同类型和质量的文章其BeRead值差距并不是太大,根据我的经验每篇首页文章的阅读数大约在500~3000这个区间范围,最多相差5,6倍。而BeComment值则相差很大,少的有几乎为0的,普通文章4,5次,多的则达可到300次以上,相差上百倍,如果再乘上系数10,就更为可观。

文章质量问题
因 此,那些吸引眼球、引起争议的文章会为博客带来巨大的积分。我们常常看到首页上一些非技术文章门庭若市;一些高质量的技术文章,反而只有寥寥几篇回复。 一个好的技术博客,应该鼓励产生高质量的原创技术文章,这才是它的核心价值,而并不是仅仅是像门户网站一样赚取人气。那么应如何区分文章的质量呢?当然, 最直接的方式就是读者反馈。现在博客园已经有了【推荐】和【反对】的反馈功能,不妨利用起来作为积分计算的参考依据。有了这个参数,就能区别对待不同质量 的文章,让高质量的文章为作者带来更多的积分。至于具体实现,我还没有一个很好的模型,只能随便想个简单的,比如定义文章质量因子:

QualityFactor = log(max(1, 推荐数 - 反对数))

在计算积分的时候可以考虑把评论数或阅读数乘上这个质量因子。

PersonRank vs PageRank
在互联网上,如果一个网页被很多其它网页所链接,说明它受到普遍的承认和信赖,那么它的排名就高,这就是Google PageRank算法的核心思想。PageRank把链接视为源对目标网页的投票,而这张票的分量是和源网页自身的PageRank相关的。下面是一个简单的示意图:

这在博客园内有类似的情况,博客园有MVP,有排名靠前的著名人物,他们的文章常常会得到大家的追捧,而普通新手的影响力则一时难以与他们相比。这就说明, 博客或者说作者,与互联网的网页有类似之处,是有Rank之分的,当然这个Rank是动态变化的。如果把评论看成是对文章的投票,而这张票的分量与投票者自身的影响力相关,这就可以产生类似PageRank的PersonRank。假设园内某MVP评论某篇文章,一般来讲他的评论应该比普通评论更有分量。当然,这里还应该考虑正面评价和负面评价因素,如果他持推荐意见,应该加分,如果他持反对意见则不应该加分。

马太效应

什么是马太效应?举个热门新闻算法的例子,越是热门新闻大家越是去点,越去点它就越热门,形成一个恶性循环。如果算法不好,热门或许就会永远热门下去。同样的道理,在博客园里面,积分高的作者的文章越是热门,越是热门他的积分就越来越高。那么应该如何避免马太效应,鼓励新人辈出呢?常见的方式有两种,一是衰减机制,比如,一月前的文章产生的积分应该乘上一个衰减系数(比如0.9),从而使近一个月的文章产生的积分所占权重变大,这样就避免成名后坐吃山空的现象,真实地反映出作者近段时间的贡献;二是log函数,对点击数和评论数取log以后再作为积分,让积分的增长变得平滑,避免极端大的分值出现。

一时兴起,随便想了这么多,抛砖引玉,大家见仁见智!再次声明,本文是纯学术探讨,不构成对博客园的任何改动建议。

博客园积分与排名升级攻略 //转相关推荐

  1. 接口应用小玩具-博客园积分排名变动监控工具

    小玩具-博客园积分排名变动监控工具 一个简单的在线服务监控和提醒工具 1   概述 前段时间自己准备重新开启自己的博客园,然后还和一些圈子里面的朋友夸下海口,自己要开始像打游戏那样,进行博客园的 天梯 ...

  2. 博客园今天将排名计算错误了

    20190309,博客园今天将排名计算错误了~~~~~~~~~~~~~ 更新20190311 今天彻底没有积分和排名了 我做了什么吗? ? 忍不住,吐槽一下博客园的排版 今天觉得以前一遍随笔中,少了点 ...

  3. [其它] - 博客园积分算法探讨

    来源:http://www.cnblogs.com/weidagang2046/archive/2009/07/31/1535902.html 今天在dudu的<博客园FAQ>上看到了博客 ...

  4. 痞子衡嵌入式:我的博客园积分排名终于挤进了前3000名榜单

    继今年2月解锁了写技术博客第一个目标 <我的博文总量终于追平了中文Kinetis博客第一人jicheng0622> 之后,时隔两个月,痞子衡又达成了第二个小目标,博客首次进入博客园榜单(该 ...

  5. WordPress博客系统搜索引擎优化seo全攻略-新华站长网

    1.空间的选择 wordpress要求 php mysql的支持,rewrite功能,比如apache的mod-rewrite或iis rewrite. 空间的速度,Google已经明确把空间的速度列 ...

  6. WordPress博客系统搜索引擎优化seo全攻略方法

    WordPress的文章.评论等很多数据都是存放在数据库的,所以搭建wordpress网站的时间,网站的空间不需要多大,而数据库一定要充足,而在WordPress数据库中主要使用 wp_posts 表 ...

  7. 博客园有人随笔总数10000+?

    数说博客园之----随笔总数 前两天在博客园首页的一个角落里发现一个有意思的链接:这个页面汇总了博客园积分前3000名的用户. 博客列表(按积分),这里列出了博客园的积分前三千名.恰好这阵子在折腾爬虫 ...

  8. 博客园的博客积分与排名查看方法

    我是今天才知道,out.因为这东东默认是不显示的,因此找不到. 注意:只是你在博客园的博客的积分排名,而不是你的在博客园的排名. 设置-博客设置(博客后台管理)-选项-积分与排名打勾.刷新你的博客页面 ...

  9. 【Vegas2010】cnblogs(博客园)排名原来是这样算的~

    在博客园呆了有快4年多了,几乎是每月都有很多文章往上写,但不知怎的,最近博客排名,再也不像以前那样明显的提升了. 查了半天,才发现博客园的排名积分规则是这么定的: 博客排行榜排名分值是如何计算的? 博 ...

最新文章

  1. 2022-2028全球与中国跨临界二氧化碳系统市场现状及未来发展趋势报告
  2. nginx不同server不同日志文件_招标里的答疑是什么?和澄清文件有何不同?
  3. thymleaf th:text 和 th:utext 之间的区别
  4. WebRTC手记之初探
  5. 2. with check option能起什么作用?_家装要选择第三方装修监理吗?为什么?
  6. python tkinter pack 同一行_用python tkinter中的一行连接2个复选按钮
  7. Hibernate错误处理:Unable to get the default Bean Va...
  8. anaconda + tensorflow +ubuntu 超级菜鸟,大家多指正【转】
  9. 吉米多维奇数学分析习题集学习指引
  10. 向量叉乘在永磁同步电机电磁转矩计算中的应用
  11. 中文乱码问题解决大全
  12. PHP爬虫微博某个话题的所有内容,GitHub - wansho/sina_weibo_crawl: 爬取新浪微博某一话题的数据,可以替代微博搜索接口...
  13. 年仅 28 岁就宣布从字节跳动退休?
  14. 健康知识竞答线上活动方案——微信答题小程序实现
  15. 【软件工程】软件维护
  16. ASO优化|标题、描述、关键词的最优策略
  17. rails-redis hgetall与hGetall
  18. umap算法_科学网—[转载]【源码】均匀流形近似与投影(UMAP)算法仿真 - 刘春静的博文...
  19. JavaScript走动的小人
  20. python数据收集整理教案_(完整版)《数据收集整理(例1)》教案

热门文章

  1. Java程序员面试时记住这些谈薪技巧,让你薪资提升30%
  2. ImageNet数据集应用
  3. House and home
  4. MS5351M时钟发生器芯片兼容SI5351-datdsheet
  5. Java 线程池 +生产者消费者+MySQL读取300 万条数据
  6. 2021年Java大数据难不难学
  7. java基础梳理--朝花夕拾(二)
  8. 基恩士KV8000系列PLC,控制松下总线伺服和山社总线步进电机,全套图纸,DWG格式,一整套图纸发给你
  9. 计算机基础应用知识ppt,计算机应用基础【计算机基础知识】课件.ppt
  10. 51单片机入门——步进电机