亚马逊图书买200减120,买了一堆书。第一本开始阅读的就是这本《决战大数据》。

这本书没有什么理论,定义之类的描述,基本都是个人经验和感悟,全是干货,十分适合不愿意看枯燥课本的同学。要说缺点就是,逻辑性不太清晰,更像是长者在叙事性地娓娓道来,倒是挺适合技术人员看的。

目前大数据很火,但是真正能理解其中的奥妙,能正确熟练地使用大数据的人和企业却很少。

“收集数据的人不知道数据可以做什么用,使用数据的人不知道数据的来源”

这样的断层,导致数据的收集没有章法没有预见没有灵魂,而数据的使用充满了疑问并且没有头绪。

我在实际生活中遇到的相关例子,不知道和书中内容联系的是否正确,但是也算是一点启发:

我很喜欢网购,经常在淘宝买东西。淘宝有一个自己的二手平台,叫做闲鱼,我手机里安装了淘宝和闲鱼这两个软件,因为买买买总会有失手的时候,这时就需要转卖。

在用淘宝购买东西,订单结算完后,过一段时间,闲鱼会给我发送推送,推送的内容基本就和我刚买的东西一样。(淘宝这个软件也是这样)

比如我买了一双绑带平底鞋,闲鱼和淘宝的推送内容一般是:这里有你想要的,绑带平底鞋......

这时我就会很无语,正常人(土豪请无视)会刚下单一双鞋后,还会对相同的鞋子感兴趣吗?除非是生活易耗品(牙刷卫生纸之类),不然真的不会同一种风格的东西买两个(至少对于女生来说是这样的),即便是易耗品,一般都是一次买很多量,一两天内不会再买,这样的推送也没有任何意义。或者推送一些比自己刚刚买的更漂亮更便宜的同类型的商品让我莫莫后悔,暗自神伤?

于是我在想,如果收集到用户的行为,比如检索某一样东西的关键词,但是没有购买行为,那么推荐这个关键词相关的商品的确是正常的。

但是用户在购买完成某样商品后,推送也许该是包含该商品的同类商品以及该商品相关的配套商品,比如买了绑带平底鞋,那么我接下来想看到的内容大概会是绑带中跟鞋,绑带圆头鞋,适合穿绑带鞋的连衣裙,甚至是后跟垫,足部防磨膏,漂亮的透明玻璃袜子......如果能把绑带这个词和lace-up联系起来,那么联想到我也许不仅喜欢绑带鞋子,还会喜欢今年流行的lace-up衬衣,lace-up连衣裙,还有包......

如果真是这样,我就可能会花掉一个下午的时间在淘宝上买买买,买齐一套装备。虽然花了更多的钱,但我依然会很开心,因为不用再费心去检索其他的东西,就像有个导购一样,引导着我购物。

转载于:https://www.cnblogs.com/qqxy/p/5430426.html

《决战大数据》读书笔记(一) 收集数据和使用数据要有关联相关推荐

  1. 数据之道读书笔记-06面向“自助消费”的数据服务建设

    数据之道读书笔记-06面向"自助消费"的数据服务建设 数据底座建设的目标是更好地支撑数据消费,在完成数据的汇聚.整合.联接之后,还需要在供应侧确保用户更便捷.更安全地获取数据.一方 ...

  2. 【读书笔记-数据挖掘概念与技术】数据立方体技术

    基本概念: 基本单元:基本方体的单元 聚集单元:非基本方体的单元 冰山立方体:部分物化的立方体 最小支持度(最小支持度阀值):部分物化的最小阀值(说白了就是限定了一个范围) ∵冰山立方体仍有大量不感兴 ...

  3. 《C++并发编程实战》读书笔记——chapter 3_线程间共享数据

    更多的阅读笔记,及示例代码见 Github https://github.com/anlongstory/C-_Concurrency_in_Action_reading_notes 本章主要内容: ...

  4. 【读书笔记->数据分析】03 BDA数据可视化

    数据可视化 介绍 章节内容 数据可视化的概念.原理与各种常用的分析方法 考试内容 数据可视化简介 (1) 数据可视化的基本概念 (2) 数据可视化的发展历史 (3) 数据可视化的基本作⽤ (4) 数据 ...

  5. 机器学习实战---读书笔记: 第11章 使用Apriori算法进行关联分析---2---从频繁项集中挖掘关联规则

    #!/usr/bin/env python # encoding: utf-8''' <<机器学习实战>> 读书笔记 第11章 使用Apriori算法进行关联分析---从频繁项 ...

  6. 大数据之路、阿里巴巴大数据实践读书笔记 --- 第十六章、数据应用

    本篇主要介绍两个应用:提供给外部商家使用的数据产品平台-生意参谋和服务于阿里巴巴内部的数据产品平台 一.生意参谋 作为大数据公司,阿里巴巴在推动业务数据化的同时,也在不断地帮助商家实现数据业务化.在对 ...

  7. 大数据读书笔记(1)

    1. 数据分片与路由 抽象模型为两级映射关系,第一级映射是key-partition映射,第二级映射是partition-machine映射. 数据分片有哈希分片和范围分片: 哈希分片只支持点查询,如 ...

  8. 大数据之路、阿里巴巴大数据实践读书笔记 --- 第十五章、数据质量

    随着IT向DT时代的转变,数据的重要性不言而喻,数据的应用也日趋繁茂,数据正扮演着极其重要的角色.而对于被日益重视的数据,如何保障其质量是一个关注的话题: 数据质量是数据分析结论有效性和准确性的基础, ...

  9. 大数据读书笔记(2)-流式计算

    早期和当前的"流式计算"系统分别称为"连续查询处理类"和"可扩展数据流平台类"计算系统. 流式计算系统的特点: 1)低延迟 2)极佳的系统容 ...

  10. 《推荐系统实践》 第四章 利用用户标签数据 读书笔记

    推荐系统的目的是联系用户的兴趣和物品,这种联系需要依赖不同的媒介.GroupLens在一篇文章(文章名是"Tagsplanations : Explaining Recommendation ...

最新文章

  1. 糍粑大叔的独游之旅-开篇语
  2. 倒计时3天|阿里云数据库创新上云峰会亮点剧透
  3. mysql 日期前n天_MySQL日期范围查询,当前日期的前后几天
  4. 机器学习预测+akshare
  5. python代码-20个Python代码段,你需要立刻学会,好用到哭!
  6. android在副屏中运行一个应用_Android 双屏显示分析
  7. PC Logo入门指南
  8. 工地门禁实名制考勤管理系统
  9. 我的007之skyfall歌词鉴赏及翻译
  10. HTB靶机:RainyDay
  11. (二)史玉柱:我的营销心得有感------主要关注网络游戏策划
  12. 微信境外支付php_PHP微信支付功能示例
  13. C++ OpenCV 抠商标图片文字背景透明
  14. Zigbee设备入网流程分析(关联方式)
  15. 樱花的季节,教大家用canvas画出飞舞的樱花树
  16. bookkeeper命令行操作
  17. mybatispuls 如何通过时间进行范围查询
  18. TMF大数据分析指南 Unleashing Business Value in Big Data(一)
  19. 求一元二次方程的根【C++】
  20. 佳顺通用进销存系统去广告_母婴收银系统应该如何选择?

热门文章

  1. 灭霸一个响指,被腰砍的电子阅读市场步入终局之战?
  2. Debian参考手册(3-4)
  3. failed to req API:/nacos/v1/ns/instance after all servers([192.168.43.148:8848]) tried: ErrCode:503,
  4. R-CNN文章详细解读
  5. (论文笔记)NeRV: Neural Representations for Videos
  6. 在win7系统下使用TortoiseGit(乌龟git)简单操作Git@OSC
  7. syswow64删除文件_什么是SysWow64文件夹 SysWow64文件夹可以删除吗
  8. 基于51的LCD1602计算器
  9. 一文读懂 delete和delete[ ]
  10. python人狗大战游戏_day23 02 组合(继续人狗大战游戏)