近几年,推荐算法越来越火。所谓推荐算法,其实是计算机专业中的一种算法,通过一些数学算法,推测出用户可能喜欢的东西。

推荐算法的价值在于帮助用户解决信息过载,做出更好的选择,这也是现在互联网领域最强大和最流行的信息发现工具之一。日前,娱乐向机器学习解说选手莫凡在公众号“华章计算机(ID:hzbook_jsj)”发表文章,文章分析了推荐算法背后的原理,以及推荐算法为何会“失灵”。

以下是重点内容。

1. 推荐算法为啥这么“灵”?

互联网最大的特点就是有海量的信息,不过,光是数量庞大是没有任何意义的,只有信息真正发挥作用才能产生价值。所以,如何让信息发挥价值,始终是互联网发展的一条主轴。

在推荐算法系统出现之前,互联网公司通常的做法是发现信息,这就是搜索引擎。搜索引擎很有用处,但限制也很明显,遗留了很多问题。比如,你要用搜索引擎找信息,不是直接就能得到想要的结果,而是得先掏出一个“关键词”输入进去,然后才能看到命中的结果,这个过程叫做信息检索。

也就是说,你得先知道自己对什么信息感兴趣,得有线索,然后才能通过搜索引擎检索信息。这样做存在一个问题:互联网实在太大了,而人的认知圈子实在太小了,这就导致大量本该有价值的信息,因为没被人看到,只能静静躺在角落里被白白浪费掉了。

推荐算法是怎么做的呢?它改变了搜索引擎的做法,不再是发现信息,而是发现兴趣。其实推荐算法的原理远没有想象中的那么复杂,用一句话概括就是:依靠人和物的关联关系,最少只要经过三次关联,就能完成兴趣发现,进行一次推荐。

比如,小明经常去一家便利店买可乐,店长就会知道小明对可乐感兴趣,这是第一次关联——小明关联可乐。店长还知道另一位顾客小华也对可乐感兴趣,这是第二次关联——小华关联可乐。不过,小华除了买可乐,还喜欢买薯片,这是第三次关联——小华关联薯片。

当小明再去买可乐的时候,店长觉得,既然他俩都爱喝可乐,没准小明也喜欢薯片,于是店长就向小明推荐了薯片。这就是基于兴趣的推荐算法。有人说,推荐算法比另一半更懂你,当你明白了推荐算法的原理,就知道这是理所当然的事情。

其实推荐算法的原理并不复杂,但要想在实际中发挥好作用,还需要根据应用场景做很多调整。推荐算法的重心在于发现人与人之间的共同点,但怎么划分共同点,是有很多不同的方法的。有基于视频节目的推荐,比如“看过这个视频的观众还看过”;也有基于地理位置的推荐,比如“同城的观众都在看”等等。

早期做推荐很简单,是基于点击量来推荐,但后来大家发现,基于点击量的推荐没法发现差异化的兴趣。所以,要想实现一套好用的推荐算法,通常要综合方方面面去考虑,而不只是单独的一两个点。

2. 推荐算法为啥有时会“失灵”?

多数时候,推荐算法是没什么问题的,但一旦出现极端情况,它就会“失灵”。比如,出现了一个爆炸话题,算法推荐的都是这个话题下的相似内容,把其他信息都湮没了。

其实这个现象可以用“长尾理论”来解释:人类社会中存在着大量的小众需求,你贩卖的东西再离经叛道,也能得到真爱的捧场,互联网就是沟通小众需求的桥梁。推荐算法在很大程度上也受了这种理论的影响,所以有一种说法是:推荐算法的最终目标就是能发现一个个小众圈子,把小众的信息推荐给圈子里的人。此外,还有一种“失灵”的情况就是“头部效应”。

很多信息占据头部,所以容易被推荐,因为容易被推荐,所以继续占据头部,形成循环。在推荐算法下,这种“头部效应”会更加明显。这个问题应该怎么解决呢?从技术的角度看,要想解决这个问题就四个字:去极端化,把极端情况变得不那么极端就可以了。

比如,很多依靠评委打分的比赛为了避免受极端情况影响,通常会选择采取去掉一个最高分和一个最低分的做法,就是类似的思路。不过,技术本身是中立的,是正是邪,还要看使用它的人。算法自己是不会产生价值观的,算法的价值观,说到底还是人的价值观。

推荐算法究竟要怎么改,说到底还是要看推荐算法的使用者怎么定义价值。

转载自:https://time.geekbang.org/column/article/249609

一文讲清推荐算法原理相关推荐

  1. 3分钟了解今日头条推荐算法原理

    今日头条的内容分发算法一直颇神秘低调.自12年开发运营起进四次改版,从未透露核心内容. 2018年1月,今日头条资深算法架构师曹欢欢博士,终于首次公开今日头条的算法原理,以期推动整个行业问诊算法.建言 ...

  2. 抖音推荐算法原理全文详解

    阅读目录 一.系统概览 二.内容分析 三.用户标签 四.评估分析 五.内容安全 抖音推荐算法原理全文详解 本次分享将主要介绍今日头条推荐系统概览以及内容分析.用户标签.评估分析,内容安全等原理. 回到 ...

  3. 万字长文揭秘今日头条、抖音的推荐算法原理!

    点击上方"开发者技术前线",选择"星标" 18:50 在看 真爱 来自:今日头条 编辑:可可 www.toutiao.com/a6511211182064402 ...

  4. 今日头条推荐算法原理全文详解之一

    本次分享将主要介绍今日头条推荐系统概览以及内容分析.用户标签.评估分析,内容安全等原理. 今日头条推荐算法原理全文详解 今日头条 数据分析 产品经理 产品 好文分享 第1张 一.系统概览 推荐系统,如 ...

  5. P,NP,PSPACE都是什么,一文讲清计算复杂性分类

    P,NP,PSPACE都是什么鬼一文讲清计算复杂性分类 7种计算复杂类的关系 导语 对于计算机来说,哪些问题是容易计算的,哪些是几乎不可能的?这些是计算复杂性领域的核心问题.本文是对这些问题的鸟瞰.( ...

  6. 今日头条推荐算法原理全文详解之四

    三.用户标签 内容分析和用户标签是推荐系统的两大基石.内容分析涉及到机器学习的内容多一些,相比而言,用户标签工程挑战更大. 今日头条推荐算法原理全文详解 今日头条 数据分析 产品经理 产品 好文分享 ...

  7. 一文讲清-NFT市场新秀SudoSwap的AMM机制-创新挑战与局限

    NFT交易市场的近期颓势频现,整个市场的流动性大幅降低,而此时8月异军突起的SudoSwap则凭借一超多强的增长数据,让基于AMM机制的交易市场映入大众视野. 基于链上数据分析截至8.20日,已有上千 ...

  8. 常见的推荐算法原理介绍

    常见的推荐算法原理介绍,随着互联网的发展短视频运营越来越精准化,我们身边常见的抖音.火山小视频等软件让你刷的停不下来,这些软件会根据你的浏览行为推荐你感兴趣的相关内容,这就用到了很多推荐算法在里面. ...

  9. 抖音推荐算法原理是什么?四川鹰迪

    在抖音上面肯定也需要去了解一下抖音推荐算法原理,并且也要想办法去让抖音推荐算法上热门,四川鹰迪小编马上就来给各位卖家们详细的介绍一下. 我们在讲抖音SEO如何做之前,那么先要了解下抖音搜索算法工作原理 ...

最新文章

  1. 25万亿规模!中国智慧城市建设刚需在哪?
  2. android 通知折叠点击,如何折叠Android通知?
  3. 腾讯内部人士爆与老干妈合作多个环节有漏洞 却没人察觉
  4. Python-面向对象编程
  5. java分布式系统开发_从微服务到分布式系统-Java开发人员生存指南
  6. python调用.a静态库_Python 调用 C
  7. 20.校准相机——介绍,使用已知点进行校正,直接线性校准均匀性第1部分,直接线性校准均匀性第2部分_1
  8. [置顶] Oracle 11.2.0.3.0 Active Data Guard 遇 ORA-10458、ORA-01152、ORA-01110 错误
  9. 小米、搜狗、TW等机器学习算法工程师面试总结
  10. Word文档快速调整表格列宽度
  11. matlab异步电机仿真,基于MATLAB的异步电机仿真系统
  12. AC-DC可调5V输出电流可调电源芯片资料参考
  13. 代码生成工具的实现思路
  14. 毕业之前要做的20件事
  15. php微创手术价格,膝盖疼困扰大半年,终于做了关节镜微创手术
  16. 昕友亿方InfoPath智能平台软件视频教程公开,4分钟学会轻松定制企业级应用软件
  17. ios基础篇(十四)—— 操作依赖、操作缓存池
  18. NB-IOT技术实践开发
  19. Android热补丁动态修复实践
  20. Vue中 实现文件流格式图片预览

热门文章

  1. 亚马逊挽救时尚业?时尚业转型进行时
  2. PHP编号排序AAA001,AAA002,AAA003...AAA999,AAB001,AAB002...ZZZ999
  3. C# 流水号、顺序号(范围001-ZZZ,31进制,0-9,B-Z,26个字母去除A/E/I/O/U)
  4. 记第一次组装台式电脑电源的小插曲附电源线接口汇总
  5. ShowMeBug 荣膺「2021年中国人力资源科技创新产品奖」
  6. 产品创新,价值的4个层次——“发明”只是最低要求
  7. oracle什么是死锁,oracle中死锁是什么
  8. JS判断移动端上拉和下滑
  9. 找回Administrator的密码方法两招
  10. [附源码]Python计算机毕业设计SSM基于微信的基层党建信息系统(程序+LW)