本节书摘来异步社区《MapReduce 2.0源码分析与编程实战》一书中的第1章,第1.5节,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区“异步社区”公众号查看。

1.5 看,大象也会跳舞

大象也会跳舞。当人们还在争论大数据处理能否为自己所在的行业带来革命的时候,部分行业领袖已经在享用大数据处理给自己带来的非凡好处。

Hadoop一个最为普遍的应用是为获得的海量数据提供处理程序,从而能够获得其中包含的各种信息。例如经常使用的聚类推荐,向感兴趣的顾客推荐相关商品和服务;或者为广告供应商提供具有针对性的广告服务,并且通过点击率的反馈获得统计信息,进而有效地帮助他们调整相应的广告投放能力。

长期以来,互联网巨头,包括Yahoo!、Google等广告商为其投放的标准广告类型提供了多种广告计费方式。首先是基于点击数计费的广告形式,即根据查看和点击这个广告的人群数目付费的广告投效方式。此外,还有根据网上查看到广告的人数比例进行付费的模式,此项广告投放简单,但是针对性较差,无差别的投放并不能带来好的收益和效果。随着技术的进步,更多的动态广告内容被广泛应用到广告投放形式中来,即根据个人的喜好和习惯制定个性化广告。而Hadoop可以在网站后台进行准确的数据抓取和结果分析,从而更为准确地推荐广告。例如社交网站Facebook上某一个用户经常通过网上链接购买某个品牌的饮料,而Hadoop可以在后台准确地记录其购买次数和口味类型,并通过其与好友分享信息的关键字对数据进行整体处理,从而可以向该用户推荐符合其口味的某项新产品。

同样,Hadoop一个更为典型的应用是分析某一段时间内登录到某个既定网站的平均用户数,或者找到用户数最低点,从而为进行服务器维护提供合适的时间。这个工作繁重而且复杂,这是因为要涉及浏览全部的日志文件,对其进行提取和处理,并根据相应的算法将数据分组。而对大数据的处理恰好是Hadoop的强项,可以很容易地找出不同时间段的人员均值,并获取最低值,从而解决维护时间问题。

小提示:
沃尔玛通过Hadoop分析出放置位置最为接近的商品应该是“尿布与啤酒”。刚开始,数据处理人员对这个结果也感到困惑,调查得知大多数购买尿布的是下班后的男性工作者,因其回家后无法外出,只得同时购买啤酒回家看电视。
这一切如果没有Hadoop几乎很难完成,同时,也间接证明了数据和Hadoop本身并不能带来如此的神奇效应,然而一旦联系在一起,则可以发现以前从来没有发现的数据点,从而使分析和挖掘成为了可能。

本章小结

《MapReduce 2.0源码分析与编程实战》一1.5 看,大象也会跳舞相关推荐

  1. 《MapReduce 2.0源码分析与编程实战》一第1章 HBase介绍

    本节书摘来异步社区<MapReduce 2.0源码分析与编程实战>一书中的第1章,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区"异步社区"公众号查看. ...

  2. 《MapReduce 2.0源码分析与编程实战》一1.6 本章小结

    本节书摘来异步社区<MapReduce 2.0源码分析与编程实战>一书中的第1章,第1.6节,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区"异步社区"公 ...

  3. 《MapReduce 2.0源码分析与编程实战》一第2章 入门

    本节书摘来异步社区c书中的第2章,第2.1节,作者: 王晓华 责编: 陈冀康,更多章节内容可以访问云栖社区"异步社区"公众号查看. 第2章 入门 HBase实战 本章涵盖的内容 连 ...

  4. SRS4.0源码分析-序言

    <SRS4.0源码分析>专栏,会从 configure(配置),makefile(编译规则),main (入口函数), 带你一步一步了解 SRS 的主干代码逻辑. 这里分享一个本人阅读开源 ...

  5. Tomcat7.0源码分析——Session管理分析(下)

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/beliefer/article/details/52451061 前言 在<Tomcat7.0 ...

  6. vue-cli 3.0 源码分析

    写在前面 其实最开始不是特意来研究 vue-cli 的源码,只是想了解下 node 的命令,如果想要了解 node 命令的话,那么绕不开 tj 写的 commander.js.在学习 commande ...

  7. Tomcat7.0源码分析——Session管理分析(上)

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/beliefer/article/details/52450268 前言 对于广大java开发者而言, ...

  8. Android6.0源码分析—— Zygote进程分析(补充)

    原文地址: http://blog.csdn.net/a34140974/article/details/50915307 此博文为<Android5.0源码分析-- Zygote进程分析> ...

  9. android6.0源码分析之Zygote进程分析

    在android6.0源码分析之Runtime的初始化一文中,对Zygote进程的初期的Runtime初始化过程进行了分析,在Runtime启动结束后,会对Zygote进程进行初始化,其它Java进程 ...

最新文章

  1. 交互式多模型_DeepFaceLab824版 Avatar换头模型尝鲜!
  2. mysql keepalived低版本_Mysql+keepalived主主切换
  3. eplise怎么连接数据库_基于手机信令的大数据分析教程(一)数据导入数据库
  4. mysql怎样删除上一行_mysql如何删除第一行数据
  5. 回发或回调参数无效。下拉菜单中使用ajax,联动菜单引起的问题解决方案
  6. linux下使用DBCA(database configuration assistant)创建oracle数据库
  7. redis如何解决秒杀超卖java_Spring Boot + redis解决商品秒杀库存超卖,看这篇文章就够了...
  8. 当亿级流量App开始“玩”,到底在玩什么?
  9. C++ sodoku solve数独算法(附完整源码)
  10. mmap直接操作底层,相当于驱动
  11. hdu 6396 Swordsman (技巧)
  12. mysql5.6开启memcache_php – 使用MYsql 5.6 Memcache
  13. centos7提示ifconfig command not found解决
  14. springboot的war部署到tomcat正常启动,访问404问题
  15. 控制器设计:MIPS单周期CPU
  16. 红蜘蛛显示器测试软件,红蜘蛛5校色仪怎么用?显示器校色及测试色域和色彩精准度详细教程...
  17. 飞秋FeiQ可以聊天,但无法传输文件
  18. java中级程序员面试题_51CTO下载-JAVA中级程序员面试题
  19. 响铃:含着金钥匙的HomeKit如何才能大器晚成?
  20. unity3d 压缩文件夹和压缩文件

热门文章

  1. oracle 查看最大连接数与当前连接数
  2. sed与正则用法收集
  3. swapLexOrder
  4. Proteus仿真错误解决方法:No power supply specified for net 5V in Power Rail Configuration.
  5. designer pyqt5 界面切换_PyQT5堆叠布局:切换界面(QStackedLayout)
  6. python装饰器模式带参数_Python进阶(七)----带参数的装饰器,多个装饰器修饰同一个函数和递归简单案例(斐波那契数列)...
  7. flyway版本号_各个互联网公司都在用的开源数据库控制器Flyway
  8. artcam2008 stp 教程_ArtCAM_中文版使用教程
  9. mysql查阅建立的库_mysql 怎么查看创建的数据库和表
  10. Struts初学者教程