本文讲的是在算法横行的时代,仍需要人类把关,

Greg Linden 或许不是一个家喻户晓的名字,但他改变了我们与文化的相互影响并且永久变革了零售业。作为九十年代晚期 Amazon 的一名工程师,Linden 要解决一个奇怪的问题:如何在没有人工干预的情况下向顾客推荐书籍。那时 Amazon 还要依靠编辑们每年写上上百篇评论。这不仅费钱还费时。

自动化推荐在当时是难以想象的棘手。 Linden 成功破解了这个难题。他把目光放在 "个性化" 上,矛盾的是,这关注的是产品之间的相关性而不是个人购买历史。忽略过去的购买记录后, Amazon 发现如果 A 产品一般和 B 产品一起售出,也就是说几乎所有人买 A 时也会想买 B。 Amazon 通过不同的售书方法的销量测试了这一发现。不消说:编辑们要卷铺盖走人了。人类退出,机器当道。一些估算显示因为这些推荐算法, Amazon 的营业额上升了 1/3。从此,算法被大量使用。现在书籍、文章、音乐、电影,还有不消说的度假和服装,都是通过机器推荐的。

去年,英文书籍新出版了一百万册。至少从古希腊开始,人们已经觉得要读的东西太多了。当然,这还没算上那些有作者自己出版的图书,大量新闻或者是浩瀚无边的互联网。不管怎么说,我们都处在令人惊讶的阅读过剩之中。

我们拥有的越多,我们就越依赖算法和自动化推荐系统。因此,推荐算法、机器学习、人工智能和大数据不可抵挡地侵入了文化领域。

然而故事并没有结束。例如搜索引擎,能告诉我们想知道的内容,但有一些内容是我们需要的,但是我们暂时还没有想到,对于这些内容,搜索引擎就帮不上忙了。人类的挑选和识别力在算法时代有了新的意义,远不能消失。是的,随着拥有的越多,我们越来越需要算法了。但是我们也更加希望见多识广和特殊选择。人类又回来了。

这是为什么尽管有全世界最强大的图书推荐引擎,Amazon 还是买下了 Goodreads —— 一个主营个人书籍评论的网站。这也是为什么像 Canopy.co 这类的网站活跃程度在 Amazon 之上。Canopy 知道 Amazon 最棒的商品隐藏在一堆乱七八糟的东西里。Canopy 的创始人全都是设计师,每天筛选数千条记录以重点标注高质量商品。

这是为什么尽管在网上能找到任何想要的书,但出版商仍印刷新的书籍满足多样化与个人书单,书店也再次兴起的原因。我们能够漫不经心的查看桌子上的书籍。在日本,人们谈论 tsundoku,即太多书可读的不安感受。他们自有解决办法:东京银座书店一次就只售卖一本书。

这个在内容挑选上重焕生机的趣味不仅出现在出版业。在 Spotify(某在线音乐播放器)上,你可以听 30m 的音乐,其中20%一次都没播放过。为了帮助管理庞大的音乐目录,Spotify 花了 1 个亿收购了 the Echo Nest 公司,后者拥有一项先进技术,用于识别音乐,自动分类曲目。同时,Spotify 扩充了自己的歌单推荐人和快速成为新 DJ 的音乐专家。

Netflix 有远超观众需要的影视剧集。它是一个用数据科学管理文化的先驱者,它甚至为了研究团队们来升级它的算法而发起一个奖金 100 万美元的比赛,最后钱花出去了,却没有实现他们想要的效果。然而 Netflix 还培养观众为它的内容打一些详细的标签。他们做到了评论系统做不到的是:结局是想要的吗?胡子在电影里重要吗?

Facebook 陷入一系列信息流内容管理的争议中,从直播杀戮,到删除越战的象征图片,再到政治偏见的指控。它最近试图通过开除人工编辑消除审核流程... 仅仅为了发现信息流退化成大量虚假和有争议的新闻故事。

苹果新闻和音乐 应用有大量人工内容管理,甚至找了新闻编辑部和广播的名人们。Twitter 在它的 Moments 产品中下了重金。虽然普遍不看好,但 Twitter 确实希望在内容上做的更好。Samsung 的新闻应用分成你想知道的和你需要知道的;前者通过算法挑选,后者通过编辑。大型科技公司对老牌专家求贤若渴。

我们也有多余的东西。西欧家庭平均拥有 1 万件东西,美国家庭更多。但是处理这个情况不需要应用,只需要 Kondo 方法,这是一种依靠我们个人历史信息来整理家庭的技术,深受欢迎。在零售业的上游,成功商店的背后有一再强调的专家精选,和时尚精品 Opening Ceremony 和 ”未来超市“ Eataly 一样多样化。随着媒体发展,我们从大量工业选择时代过渡到精选时代。

精选可以是不得当的,有时还是贬义的词语,但是他的词根 curare(表示照顾的意思)却可以击中人们心中无法替代的感觉。我们想要惊喜,我们想要专业知识,独特的审美评论,无须花费时间和精力。我们体会到这混乱世界的另一种味道,体会人与人之间的信任。我们不仅想要相关性,我们还想知道为什么,想要故事,这是机器无法提供的。即使我们将精选定义为选择和排列,这也不完全是算法的工作。与许多行业经历技术破坏不同,从自动驾驶汽车到自动化会计,文化领域将一直重视人类选择和独特的感受。

这是艺术和人文对机器学习世界的反击。这会创造新的就业。信息过载和技术驱动响应是我们的时代最好的转变。但在今天这种饱和状态(和那些成堆的摇摇欲坠的书)中,知识和主观判断比以往更有价值。用一名硅谷投资人的话说,“软件吃掉了世界“。当然,软件吃不掉人类选择。与神话相反,传统守门人角色仍健在。

接下来我们将看到的是一种混合状态:充分混合了人类和机器选择来处理庞大数据集,在狭窄范围之上越走越远。我们现在有许多我们不能独自处理的东西,例如书籍、音乐、电影和艺术作品。我们需要一个 “算法文化”。但是我们比以往更需要:人类品味。





原文发布时间为:2016年12月26日

本文来自云栖社区合作伙伴掘金,了解相关信息可以关注掘金网站。

在算法横行的时代,仍需要人类把关相关推荐

  1. 在AI横行的时代,你为什么还要固守大前端?

    本文转载自前端之巅 原文地址 我对自己的定位是 Node 全栈,以大前端为主,Node 辅助,囊括所有和用户直接相关的开发.我认为这是趋势,我也确实在自身的经历中体验到了好处.目前大前端还没有形成固定 ...

  2. AI解锁无人时代 仍需数据安全保驾护航

    AI解锁无人时代 仍需数据安全保驾护航 近几年,科技企业在推广新一代信息技术产品时,数据安全.数据隐私等问题广受诟病.数据作为驱动人工智能快速发展的重要基础,其安全也决定了人工智能的安全.人工智能的加 ...

  3. 算法有偏见?总比人类识别强吧!

    在讨伐算法导致的偏见和产生的作用时,更重要的问题是:与完全没有使用算法的情况相比是怎样的?我们应该比较算法的缺陷与人类的缺陷,而不是简单地询问算法是否存在缺陷. 一场革命正在悄然进行. 这场革命与大部 ...

  4. 自媒体平台横行的时代下,企业现在有必要做网站吗?

    自媒体平台横行的时代下,企业现在有必要做网站吗? 不知从什么时候起企业网站似乎成为了企业的标配,无论是上市大公司还是新创立的中小企业几乎都有自己的企业网站. 那么在当前自媒体横行的时代下,企业现在有必 ...

  5. 百度2019年财报喜忧参半,决胜AI时代仍不好说

    2020-02-28 16:44:19 2 月 28 日,百度披露了 2019 年 Q4 及全年未经审计的财务简报.财报显示,2019 年 Q4,百度实现总收入 288.84 亿元,同比增长 6%,归 ...

  6. 如今引流横行的时代,你还缺乏流量吗?

    在圈内50%之上的"干货"文章内容全是引流有关的,总流量口子.套路方法.成套设备理论一应俱全. 为什么营销推广引流话题讨论总那么繁华?1,总流量=纸币2,互联网技术变幻无常,服务平 ...

  7. 瑞·达利欧:驾驭算法成人工智能时代基础能力

    https://www.toutiao.com/a6693853716795097611/ 全球最大的对冲基金桥水基金创始人瑞·达利欧(Ray Dalio)的著作<原则>在中国出版后就成为 ...

  8. 速来围观!leetcode java实现汇总

    文章目录 前言 一.排序 1.1 选择排序 1.2 冒泡排序 1.3 插入排序 1.4 归并排序 1.5 快速排序 二.查找 2.1 二分查找(有序数组找某个数是否存在) 三.寻找最大数字 四.两数之 ...

  9. R在线性回归中的应用--分析豆瓣评分与票房之间关系的案例研究

    一数据准备 二查看各国影片的票房概况 三通过简单线性回归研究豆瓣评分与票房之间的关系 四小结 一.数据准备 我们需要的票房数据来自CBO中国票房网,中国票房网记录了从2008年到目前为止的每年票房排名 ...

最新文章

  1. Javascript事件集
  2. bash ps1变量_在 Linux 中打扮你的冬季 Bash 提示符
  3. 需要多快的速度,才能在抽走桌布之后保持桌面物体不掉?
  4. linux下面调试C、C++
  5. [Redux/Mobx] 什么是redux?说说你对redux的理解?有哪些运用场景?
  6. 爬虫从入门到放弃——爬虫的基本原理
  7. 在Solaris 下使用Os Watcher 监控Oracle
  8. 去除Android 6.0 界面下的导航栏:NavigationBar
  9. CentOS系统优化
  10. gtShell - 为你常用的目录建立标签并快速跳转
  11. 冰点还原无法修改计算机时间,安装冰点还原后无法更改系统时间怎么办
  12. 美图秀秀一寸照片的制作
  13. android探索之UID u0_axxx的由来
  14. 江苏成人高考考前注意事项
  15. [Windows系统]openssl的安装与调用
  16. [RK3399][Android7.1] 调试笔记 --- DDR中clock相关配置
  17. 网上看到的星际制图技巧,有些反作弊的方法还是可以借鉴的
  18. 帝国cms导入html模板,帝国CMS模板组导入导出更换模板
  19. matlab中==、~=、的含义
  20. C语言的历练打怪之路(2)

热门文章

  1. 解决zabbix图形乱码
  2. SQL中,like的SQL注入防止,使用预编译SQL(?)的写法
  3. java语言定义一个具备栈功能的类_Java学习笔记 第二章 Java语言基础
  4. unknown host www.baidu.com 解决方法
  5. Tomcat不能自动编译JSP文件问题的一种解决方法
  6. Mycat分布式数据库架构解决方案--搭建MySQL读写分离环境--一主多从
  7. IOS使用pods初次加载出现Pods-resources.sh: Permission denied错误的解决方案
  8. 解决Axure发布分享预览的3个方法
  9. 终极解决VS2015 安装失败问题,如 安装包损坏或丢失
  10. 如何使用内联onclick属性停止事件传播?