写这片文章,是想讨论一下轻量级(相对于Google那种重型复杂的PageRank而言)的网页Rank算法。

一般而言,一个网页是否受欢迎,365Rss.cn所能想到的,应该涉及到3个分子因素:“点击量”、“回复量”、“用户评分”。
注:“分子因素”是我自己想的名词,也即作为被除数的因素。它的数学名词大学教过我忘了。

目前大部分国内站点都片面地关注并在数据库里面记录了以上3个因素。但是很少有网站把这些因素综合起来进行数据挖掘、分析。365Rss.cn在一开始设计的时候就考虑到这3点因素,并设计了各自的权重。


一个网页满分100分。其中:
点击量=20%
回复量=30%
用户评分=50%

计算Rank的时候,365Rss.cn还为“点击量”、“回复量”考虑到了一个分母因素:“网页年龄”。
注:“分母因素”是我自己想的名词,也即作为除数的因素。
为什么不为“用户评分”考虑网页年龄呢,因为一般而言,用户打分后的平均分,并不因为该网页存在的时间长短而成比例。相反,一定时间内的点击和回复率,往往很大程度上决定该网页是否受欢迎。

Rank计算公式如下:
Rank=(用户评分总数/打分次数)*50 +(回复量/网页年龄)*e*30+(点击量/网页年龄)*e*20
注:该公式的e为一个协调常数,具体数字是多少365Rss.cn小组暂未定。

今天太晚了,下次讲365Rss.cn网站采用的改进型轻量级Rank算法。

转载于:https://www.cnblogs.com/kaima/archive/2007/01/08/614437.html

轻量级的网页Rank算法,365Rss.cn的Rank技术解释以及算法讨论(一)相关推荐

  1. 玩转算法面试:(一)什么是算法面试?

    前言 对于面试中遇到的大多数问题 都能有一个合理的思考路径 沟通: 边界条件是怎样的? 数据范围如何? 某些术语是具体如何定义的? 基础数据结构 算法设计思想: 递归分治 贪心 动态规划 回溯搜索 L ...

  2. 365Rss.cn Beta 1.0 (内测版本)更新 2007-1-18:速度、人性化、简洁化

    1,原来是直接远程实时读取Rss,因为有些Rss速度相当慢,严重影响体验.这次我们花费很大的力气全新开发了内容采集引擎,现在是读取静态Rss数据副本,也就是Rss网页[快照].[快照]目前定为每2天自 ...

  3. 网页去重||SimHash(高效的文本相似度去重算法)——适合大批量文档的相似度计算

    网页去重 之前我们对下载的url地址进行了去重操作,避免同样的url下载多次.其实不光url需要去重,我们对下载的内容也需要去重. 在网上我们可以找到许多内容相似的文章.但是实际我们只需要其中一个即可 ...

  4. 【排序算法】Learning to Rank(二):Pairwise之RankSVM 和 IR SVM

    之前的文章:[排序算法]Learning to Rank(一):简介 中简单介绍了Learning to Rank的基本原理,也讲到了Learning to Rank的几类常用的方法:pointwis ...

  5. 推荐系统[四]:精排-详解排序算法LTR (Learning to Rank): poitwise, pairwise, listwise相关评价指标,超详细知识指南。

    搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排精排重排混排).系统架构.常见问题.算法项目实战总结.技术细节以及项目实战(含码源) 专栏详细介绍:搜索推荐系统专栏简介:搜索推荐全流程讲解(召回粗排 ...

  6. als算法参数_Spark2.0协同过滤与ALS算法介绍

    ALS矩阵分解 一个 的打分矩阵 A 可以用两个小矩阵和的乘积来近似,描述一个人的喜好经常是在一个抽象的低维空间上进行的,并不需要把其喜欢的事物一一列出.再抽象一些,把人们的喜好和电影的特征都投到这个 ...

  7. etc的常见算法_谈常用的几个机器学习算法,学懂算法也可以这么简单!

    本文的目的,是务实.简洁地盘点一番当前机器学习算法.文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的经验,将对此类模型优缺点及选择详加讨论 主要回顾 ...

  8. python算法和数据结构_Python中的数据结构和算法

    python算法和数据结构 To 至 Leonardo da Vinci 达芬奇(Leonardo da Vinci) 介绍 (Introduction) The purpose of this ar ...

  9. 多目标优化算法_阿里提出多目标优化全新算法框架,同时提升电商GMV和CTR

    论文作者| Xiao Lin,Hongjie Chen 等 编译 | 吴少杰 编辑 | Natalie AI 前线导读: 在推荐系统中,多目标优化一直是热门话题,阿里针对推荐中的多目标优化问题提出了一 ...

最新文章

  1. YOLOv4 中的 Mish 激活函数
  2. 渗透知识-SQL注入
  3. 奇异值分解(SVD) --- 几何意义2
  4. java 调用python脚本过程_通过Java调用Python脚本
  5. The Eclipse JDT Core jar is not in the classpath
  6. android 环信消息红点,环信3.0获取会话消息列表
  7. python股票历史最低点_Python统计某一只股票每天的开盘,收盘,最高,最低价格!...
  8. java中Cookie中文字符乱码问题
  9. 【AI视野·今日CV 计算机视觉论文速览 第164期】Fri, 18 Oct 2019
  10. List中对象model的排序问题
  11. c/c++教程 - 总集1. c基础语法
  12. 面试官问我什么是「栈」,我随手画了 10 张图来解释
  13. C# ToString格式字符串整理(Format)(数字、日期和枚举的标准格式设置说明符)
  14. conda创建的环境,打包下载,然后在其他设备离线安装环境,python部署时需要依赖,通过conda一步解决依赖迁移问题
  15. java单例接口_JAVA单例模式
  16. 批量修改文件夹名称的一部分字符
  17. 计算机专业自考本需要学哪几门,自考本科都考哪些科目?一次考几门?
  18. pycharm如何正确打包ocr且让打包出来的exe尽量小
  19. STM32F103ZET6的芯片工程改为STM32F103C8T6的工程
  20. 下载jdk(所有版本)

热门文章

  1. php怎么做签到系统,PHP如何实现签到功能
  2. datepick二格式 化时间_考研经验分享(三)英语二作文模板
  3. python列表切片得到的是列表还是字符串_python中列表的切片问题 python arry怎么取列切片...
  4. hdu5461(2015沈阳网络赛L题)
  5. Codeforces 1276D/1259G Tree Elimination (树形DP)
  6. dmx512协议c语言编程,DMX512协议+c程序代码.pdf
  7. au加载默认的输入和输出设备失败_一文带你读懂 C/C++ 语言输入输出流与缓存区...
  8. 2021-05-19 Schur补引理及证明
  9. Node.js 目录操作
  10. 微信小程序-学习笔记6-组件