前言

[推荐系统 - 基础教程]可能是穆晨的所有博文里,最有趣最好玩的一个系列了^ ^。

作为该系列的[入门篇],本文将轻松愉快地向读者介绍推荐系统这项大数据领域中的热门技术。

为什么要有推荐系统?

从字面意义来看,推荐系统,就是向各位读者们推荐物品的系统。于是大家自然会想到推销......

显然,这并不好玩,因为谁也不想被人打扰,而这个"推销系统"也不是本系列教程要讲解的推荐系统。

该问题的根本原因在于:传统推荐方式太low了;而一个可能让读者们感到诧异的事实是:你们已经开始频繁使用推荐系统了,而且还用得很爽。

不相信?那么我们来一一列举吧!

1. 你用过听歌软件吧?类似网易云音乐、QQ音乐、虾米音乐:

2. 你上过网上书店买书吧?类似当当、京东书城、卓越书城:

3. 来个新颖点的...你玩过王者荣耀吧?下面截图你懂的:

       4. 再来个新颖点的...你还是单身吗?听说世纪佳缘、珍爱网这些婚恋网站的对象推荐系统也做得很不错:

5. 其他应用:推荐社交网络好友、推荐新闻文章、推荐美食......太多太多,这里就不一一例举了。

真的不需要推荐系统?

即使笔者举了上述例子,相信仍有读者不服,表示他们不需要推荐系统。

这群读者应该主要分为三类:

1. A类读者:我就需要那些热门物品;   --- 排行榜是个好东西,但啥都和别人一样,岂非太无趣了?

2. B类读者:我喜欢自己去搜索我需要的物品;   --- 难道没试过突然想看本书,但纠结买哪本好?

3. C类读者:我觉得推荐系统侵犯了我的隐私;   --- 那您放弃的可能不只是推荐系统,而是整个互联网了。

不论这三类读者有没被说服,不可否认的是,对于大部分人来说,已经开始拥抱这个新生事物。

另小道消息称,亚马逊20%以上的营业额就是通过推荐系统实现的。这不单单是说明推荐系统对物品购买行为有影响,更说明对物品销售行为有影响:你也许不但能用推荐系统买东西,还能用推荐系统卖东西。

推荐系统的本质

推荐系统其本质,是为了帮助人们解决信息过载(Information Overload)问题的一项工具。

所谓信息过载,是指你所真正需要、真正感兴趣的东西,被淹没在其同类物品的海洋里。因此,为了找到它,你需要耗费巨大的时间和精力。为了解决信息过载问题,截至至今,人们经历了分类目录、搜索引擎、推荐系统三个阶段。

下文将以信息检索为例,说明人们检索方式(或者可以理解为解决信息过载方式)的演化:

在N年前,笔者热衷于使用类似5566这样的导航网站检索信息:

该网站将其他网站分门别类地整理好,我对哪个类标签感兴趣就可点进去浏览相关网站信息。这就是所谓"分类目录"的检索方式。

● 后来,有了百度。笔者直接往里面输入关键字,它就能提供我想要的网页,这让我觉得信息检索的效率更高了:

这就是所谓“搜索引擎”的检索方式。直至今天,它依然是信息检索的最主流方法。

● 再后来,笔者发现QQ经常给我弹出类似这样的信息:

这就是所谓“推荐系统”的方式了:我们不需要主动告诉系统我们对哪类数据感兴趣,也不需要提供关键字,系统根据我们的历史行为、偏好数据,将我们需要的信息提供给我们。

仔细一想,这不就是从海量的数据中挖掘知识,这不正是数据挖掘的定义么?等等,那推荐系统和数据挖掘有什么关系?好吧,再发散一下,大数据、数据挖掘、机器学习、人工智能、推荐系统等等这些概念又有什么关系?

哈哈,是不是有点晕了?这几个问题就留给读者自行思考吧,思考的过程,也是我们提升对大数据,或者说对数据本身理解的过程。

小结

阅读完本文,读者已经体会到了推荐系统的重要意义了吧。

那么,推荐系统的"后台"是如何通过建立"高大上"的算法模型,从海量数据中精准地为用户筛选出其感兴趣的物品,并将之推荐给用户呢?

这就是本系列博文后面将要涉及到的重点内容了。欢迎读者关注,和穆晨一起探讨研究当今火热的推荐系统技术~!

转载于:https://www.cnblogs.com/muchen/p/6929862.html

第一篇:你不一定了解的推荐系统相关推荐

  1. 属于窄带噪声的是热噪声_时钟201系列: 非相位噪声的情况 (第一篇)

    欢迎来到Silicon Labs(亦称"芯科科技")的新系列博客文章"时钟201"的第一篇内容-非相位噪声的情况-第一部分.我们之前的系列博文"时钟1 ...

  2. linux的自定义input,Linux Input子系统之第一篇(input_dev/input_handle/input_handler)

    Input子系统是linux kernel中与部分外围器件驱动联系比较紧密的模块,常用于Sensor,TP(touch panel),power key等器件的驱动.这类模块有个共同特点:字符设备,且 ...

  3. 第一篇文章,做个纪念

    第一篇文章,做个纪念,这个blog好吗?拭目以待! 转载于:https://blog.51cto.com/197536/88241

  4. 《Ansible权威指南 》一 第一篇 Part 1 基础入门篇

    本节书摘来自华章出版社<Ansible权威指南 >一书中的第1章,第1.1节,李松涛 魏 巍 甘 捷 著更多章节内容可以访问云栖社区"华章计算机"公众号查看. 第一篇 ...

  5. 研究生第一篇科研论文常犯问题总结

    ↑ 点击蓝字 关注视学算法 作者丨喻海良,中南大学教授,博士生导师 来源|http://blog.sciencenet.cn/blog-117889-1018759.html 极市导读 本文作者为中南 ...

  6. Webpack系列-第一篇基础杂记

    系列文章 Webpack系列-第一篇基础杂记 Webpack系列-第二篇插件机制杂记 Webpack系列-第三篇流程杂记 前言 公司的前端项目基本都是用Webpack来做工程化的,而Webpack虽然 ...

  7. 蒟蒻的第一篇博客CF1041C Coffee Break(二分+贪心+set)

    CF1041C Coffee Break(二分+贪心+set) 描述 Recently Monocarp got a job. His working day lasts exactly mm min ...

  8. Spotify敏捷模式详解三部曲第一篇:研发团队

    本文转自:Scrum中文网 引言 2018年4月,来自北欧瑞典的音乐流媒体公司.百亿美元独角兽Spotify创造了历史,它成为了当代上市公司当中,第一家通过"直接上市"的方式在美国 ...

  9. 第一篇:UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc3 in position 0: invalid continuation byt

    第一篇:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc3 in position 0: invalid continuation byt ...

  10. 人工智能写出第一篇文章:我真的没想要消灭你们,人类!

    来源:网信科技前沿 在攻克棋类,飞行操控,机器视觉,语音识别等领域后,人工智能又开始入侵写作领域. 人工智能被人类开发出来是为了方便我们人类的生活,帮助人类处理一些事物,它的优点在于其拥有庞大的数据库 ...

最新文章

  1. 的注册表怎么才能删干净_白蚁怎么才能消灭干净?
  2. python基础教程第三版豆瓣-1024,程序媛/猿请查收!
  3. mvn tutorial
  4. linux shell 博客,【博客侠】Linux Shell脚本系列:开始上手(1)
  5. python实例 97,98
  6. 【转】Android4.4 之Bluetooth整理
  7. MyBatis框架 传参、事务、缓存(二级)
  8. mysql查询特殊符号时_数据库查询中的特殊字符的问题_MySQL
  9. 7-1 打印沙漏 (20 分)
  10. android 在图上绘制字符串,Android 使用Canvas在图片上绘制文字的方法
  11. InstallShield教程-打包.NET程序
  12. 软件测试类型-文档测试
  13. Python入门教程(从小白到高级)(新版)
  14. java 只保留字母_Java所有保留字与关键字
  15. 三星堆的青铜机器人_三星堆“青铜大立人”,手里原来握的是什么东西,至今困扰考古界...
  16. unity动态加载FBX模型
  17. 根的存在定理(零点存在定理)
  18. 我偷看了老板的微信分组,整个人都不好了…
  19. 小米15.6笔记本安装UBUNTU18.04 无WIFI驱动解决方法
  20. java 设置pdf 编码格式_Java 在PDF中添加条形码

热门文章

  1. AcWing 285. 没有上司的舞会(树形DP)
  2. 计算机的用户软件在哪,电脑自带录屏软件在哪?这里教你怎么找
  3. 炮爽2 html5,HTML5入门习作2:炮台
  4. JVM系列一:JVM内存组成及分配
  5. Linux实验室 CentOS关机大法
  6. 怎样在Linux中用Vim对文件进行密码保护
  7. Beyond Compare可以进行二进制比较
  8. Android自己写的三款实用开关控件
  9. 【转】64位ORACLE客户端上plsql无法识别ORACLE_HOME解决方案
  10. [ACM] hdu 2082 找单词 (母函数)