众所周知我是吴军先生的粉,他在得到APP上的《信息论40讲》我刚学完,整理了一些个人认为重要的笔记,分享给大家。

大数据的四个特征:

1.数据量大

到底要多大,标准是让统计结果具有非常高的置信度。

2.多维度

最好各个维度是正交的,可以交叉验证数据的真实性。

3.完备性

堵住抽样调查的死角。

4.实时性

数据有时效性,有些数据过了时间段就没意思,譬如交通路况,天气等。

大数据思维的四个层次:

1.第一层,从大量的看似杂乱无章的数据点,总结出原来找不到的相关性。类似于大海捞珍珠,这是普通人对大数据的了解。然而大数据思维和过去通过大量数据验证一件事的区别在于,这些数据的产生和收集时候是没有特定目的的,怎么使用它们根据应用而定。一个很好的例子就是google trend,国内一些对标产品就是百度指数/微信指数等,由于数据收集的时候没有什么目的,所以也可能发现过去从来没想到的规律和结果。

2.第二层:不事先做假定,从大数据出发先得到结果,再分析原因。一个牛X操作就是特效药的寻找方式,从过去病理出发分析原因再寻找和研制药物的正向过程,到今天有些医学院的做法是,从现针对某疾病的药物中发现是否对其他疾病有作用,是先有了结果,再反推原因,由于有了足够的数据支持,逆向做法反而更快些。

3.第三层:利用大数据在准确把握宏观规律的同时,精确到每一个细节。

4.第四层:通过几个维度的强相关性,代替过去的因果关系。由于数据的细致和能得出结果的数目量级已经比以前高了许多,不能单一用因果关系做判断,用相关性的强弱来分析更加合理。文中举的一个例子是美国烟草公司和州检察长的官司,专家通过收集对比数据、排除基因和生活习惯、收入等后天因素,证明吸烟对身体是否有影响,最终让烟草公司低头。也标志在法律上认可不同纬度找到的强相关性可以替代因果关系作为法律依据。

这大数据思维的四个层次,层层递进。个人觉得有种从以前的零散思维到系统思维的变更。以前是单一路径解决问题,现在是所有信息和路径汇总到一个大系统里面,需要的时候调用信息再反推出相关路径,极大提高效率。

p.s. 得到APP哪些课程值得买:其实吴军先生的很多书我都买了,如果硬是要推荐,这类科技科普类,买新不买旧。觉得《科技史纲60讲》《信息论40讲》跟《智能时代》《浪潮之巅》《谷歌方法论》《硅谷来信》有部分重合,要买的话前两部会比后几个要好毕竟后面的书虽然拿过奖但也有些年代了。我还是觉得这个APP欠我广告费,啥时候给我免几单也好啊。。。

相关文章

吴军《智能时代》读书笔记

知识付费 | 我的得到APP课程学习随笔

吴军信息论40讲_吴军信息论40讲笔记相关推荐

  1. 吴军信息论40讲_吴军:有时候成功比失败更糟糕!顺势而为还是走弯路,就看一件事...

    如果你今年跟风买了一台5G手机,大概已经发现:传说中"一秒下一部电影"的神奇,实际并不存在. 作为一名通信从业者,我可以非常负责任地说:就目前来看,5G和4G在用户体验上,差别并不 ...

  2. 信息论与编码_从信息论谈数字孪生系统的大行其道

    ICT圈子里的人,尤其是学通信的,多多少少都会听说过"信息论"这个词.美国数学家香农于上世纪40年代创建了这个关于信息转换和传输的理论体系.得益于信息论,我们今天才能够方便地使用电 ...

  3. python教程第二讲_入门python-第二讲数据类型(接上一讲)

    字典的嵌套 #{[{[{[]}]}]} 总结: ​ """ 对字典进行操作 dic ={"name":'hanmeimei','wife':{&quo ...

  4. 吴军信息论40讲_得到《吴军·信息论40讲》课程介绍

    老师简介 吴军,约翰霍普金斯大学计算机科学博士.计算机科学家.硅谷投资人.著名自然语言处理和搜索专家.畅销书<浪潮之巅><数学之美><文明之光><大学之路&g ...

  5. 华为摄像头搜索软件_华为Mate 40 Pro评测:硬件和软件表现都近乎完美

    导语:华为Mate 40 Pro堪称是华为迄今为止最好的智能手机,但是它是否足以吸引用户远离三星.OnePlus甚至是苹果呢?如果您非常注重智能手机中的硬件配置,那么华为Mate 40 Pro可能会吸 ...

  6. 2020年软考信息安全工程师_基础知识精讲免费视频-任铄-专题视频课程

    2020年软考信息安全工程师_基础知识精讲免费视频-1480人已学习 课程介绍         根据新的软考信息安全工程师考试大纲和作者长期辅导考试的经验,对考试中的所有知识点进行了详细的讲解,为考试 ...

  7. 计算机组成mod2是什么意思,计算机组成原理 第2讲_数据表示.ppt

    计算机组成原理 第2讲_数据表示 青岛理工大学计算机学院 Computer Organization 青岛理工大学 * * 计算机组成原理 Principles of Computer Organiz ...

  8. 视频教程-2020年软考信息安全工程师_基础知识精讲软考视频培训课程-软考

    2020年软考信息安全工程师_基础知识精讲软考视频培训课程 河北师范大学软件学院优秀讲师,项目经理资质,担任操作系统原理.软件工程.项目管理等课程教学工作.参与十个以上百万级软件项目管理及系统设计工作 ...

  9. 韩顺平php可爱屋源码_韩顺平_php从入门到精通_视频教程_第20讲_仿sohu主页面布局_可爱屋首页面_学习笔记_源代码图解_PPT文档整理...

    韩顺平_php从入门到精通_视频教程_第20讲_仿sohu首页面布局_可爱屋首页面_学习笔记_源代码图解_PPT文档整理 对sohu页面的分析 注释很重要 经验:写一点,测试一点,这是一个很好的方法. ...

最新文章

  1. Android AIDL示例-回调方法版
  2. git-fork下来的项目(拷贝到本地 根据原来的库更新)
  3. python语言的编程模式_一种基于Python语言的EDA开发平台及其使用方法与流程
  4. 逆向查找_「函数说12」数据逆向查找很复杂?match+index让你轻松搞定
  5. [笔记]极大极小过程的alpha-beta剪枝不可与记忆化搜索一起使用
  6. 让数据库无惧灾难,华为云GaussDB同城双集群高可用方案正式发布!
  7. selenium svg标签定位元素
  8. 线性基的一些基础模版
  9. 三菱GXWorks2 程序写入CPU/从CPU读取程序
  10. Linux 字符设备驱动及一些简单的Linux知识
  11. 【C语言】 分享几个简单的代码
  12. oracle10g_database安装教程,Oracle Database 10g数据库安装及配置教程
  13. JS特效--字体逐渐浮现效果
  14. 如何长时间高效学习?
  15. 中国移动SP短信网关接入平台
  16. exp和expdp的filesize参数的使用--导出多个文件
  17. 第十四章第五节:Java集合框架之优先级队列PriorityQueue(堆)
  18. Qt信号与槽机制详解1-创建一个带信号和槽的例子
  19. CAB单片机开发指南
  20. mysql用脚本导入csv_用脚本把csv文件导入mysql

热门文章

  1. 11个显著提升 ASP.NET 应用程序性能的技巧——第1部分
  2. GHOST_XP详细制作过程
  3. 在内网服务器中获得真正的客户端ip的方法
  4. 安装后系统配置及优化
  5. 广域网应用场景包括哪些?—Vecloud
  6. Eclipse编译时保留方法的形参
  7. 【转】JAVA 并发性和多线程 -- 读感 (二 线程间通讯,共享内存的机制)
  8. 浅入“Block Formatting Context”
  9. [问答题] 考SQL语句的题,题太长了,实在不好回忆了。
  10. struts2 ajax请求发现执行action两次原因